BACĂ UNIVERSITATEA “Vasile Alecsandri” din BACĂU Facultatea de Ştiin e Economice

Analiza Analiza informa iilor utilizând SPSS
curs-suport de curs-

Manager de curs, Prof. univ. dr. Eugenia HARJA dr. Asist. univ. drd. Oana Ancu a STÂNGACIU

Editura Alma Mater a Universită ii din Bacău, 2012

Alma Mater (Universitatea din Bacău, Calea Mărăşeşti 157, 600115 Bacău)

Editura Alma Mater a Universită ii din Bacău este acreditată de CONSILIUL NA IONAL AL CERCETĂRII ŞTIIN IFICE DIN ÎNVĂ ĂMÂNTUL SUPERIOR

Referen i ştiin ifici: Prof.univ.dr. Elisabeta JABA – Universitatea “Alexandru Ioan Cuza” Iaşi Prof.univ.dr. Vergil VOINEAGU – A.S.E. Bucureşti / Preşedinte I.N.S. Bucureşti

Descrierea CIP a Bibliotecii Na ionale a României
HARJA, EUGENIA Analiza informa iilor utilizând SPSS / Eugenia Harja, Oana Ancu a Stângaciu Bacău, Alma Mater, 2012, ISBN 978 - 606 - 527 - 185 – 2

ISBN 978 - 606 - 527 - 185 – 2

CUPRINS
Pagina Capitolul 1 No iunile de bază ale aplica iei SPSS 1.1. Produsele şi modulele SPSS 1.2. Prezentarea aplica iei SPSS 1.2.1.Accesarea şi închiderea aplica iei SPSS 1.2.2. Principalele fişiere şi ferestre din SPSS 1.2.2.1. Fişierul şi fereastra Data Editor 1.2.2.2. Fişierul şi fereastra Viewer 1.2.2.3. Fereastra Pivot Table 1.2.2.4. Fereastra Chart Editor 1.2.2.5. Salvarea şi deschiderea fişierelor de date 1.2.3. Instrumentele utilizate în SPSS 1.2.3.1. Principalele pictograme din SPSS 1.2.3.2. Meniurile din SPSS Teme propuse pentru studiul individual Sistematizarea datelor în SPSS 2.1. Sistematizarea datelor 2.1.1. Prelucrarea primară a datelor 2.1.2. Gruparea datelor ob inute din observare 2.2. Introducerea şi sistematizarea datelor în SPSS 2.2.1. Introducerea datelor 2.2.1.1. Definirea metadatelor din Variable View 2.2.1.2. Introducerea datelor în Data View 2.2.2. Sistematizare şi organizarea datelor 2.2.2.1. Gruparea pe intervale a datelor 2.2.2.2. Organizarea datelor pe categorii 2.2.2.3. Selectarea datelor Temă propusă pentru studiul individual Prezentarea datelor în SPSS 3.1. Tabelele statistice 3.2. Tabelele statistice în SPSS 3.2.1. Tabelul pe grupe 3.2.2. Tabelul cu dublă intrare (Crosstabs ) 3.3. Reprezentarea grafică a datelor statistice 3.3.1. Elementele de bază ale unui grafic 3.3.2. Tipuri de grafice 5 5 9 9 11 11 12 13 14 15 17 17 18 24 25 25 25 26 28 28 28 34 35 35 38 40 44 45 45 48 48 49 51 51 52

Capitolul 2

Capitolul 3

Graficul Scatterplot Temă propusă pentru studiul individual Capitolul 4 Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS 4.4.3. Indicatorii medii de pozi ie 4.1. dispersiilor şi abaterilor medii pătratice pe fiecare interval de grupare după factorul determinant 4.2.3.1.3.2. Indicatorii sintetici ai varia iei 4.4. Cuantile 4.1.4. Mărimile medii şi indicatorii de pozi ie şi varia ie 4. Indicatorii varia iei 4. Mărimile medii şi indicatorii varia iei pentru o colectivitate împăr ită în grupe 4.3.1. Modul ( Mo ) sau dominanta 4.3.Calcularea mediilor.4.4.4. Regula adunării dispersiilor 4. Determinarea mărimilor medii şi indicatorilor varia iei pentru o colectivitate împăr ită în grupe în SPSS.3.1. Reprezentarea grafică în SPSS 3. Graficul prin linie (Line ) 3.4.1.4.4.1. Indicatorii simpli ai varia iei 4.1.3 Mediana – Me 4.4. Graficul Boxplot 3.4.2. Mărimi medii 4. Graficul prin bare (Bar ) 3.1.6.Construirea tabelului cu dublă intrare 4.2.1.4.1.CUPRINS 3. Asimetria 4.2.2.1.2.2.4. Verificarea regulii adunării dispersiilor folosind ANOVA Temă propusă pentru studiul individual Pagina 54 54 59 62 64 66 72 75 77 77 77 79 79 80 83 83 83 83 84 85 88 89 89 91 93 96 .1.1.1. Graficul Histogramă 3. Determinarea mărimilor medii şi indicatorilor de pozi ie şi varia ie în SPSS 4. Graficul “plăcintă” (Pie ) 3.5.3.

1.3.2.2.1. Metode analitice 5. Estimarea parametrilor modelelor de regresie şi testarea semnifica iei acestora 5. Analiza regresiei şi corela iei folosind SPSS 5. Identificarea existen ei legăturii .3.1. Analiza corela iei folosind SPSS Temă propusă pentru studiul individual 97 97 97 99 99 100 103 105 107 107 107 109 112 119 122 123 125 Programa analitică Bibliografie .2.2.1.2.2.1.CUPRINS Pagina Capitolul 5 Analiza seriilor interdependente în SPSS 5.2.2.1.1.1.2.construirea corelogramei 5. Metode elementare 5.2.2. Metode neparametrice de măsurare a legăturilor dintre fenomene 5. Stabilirea sensului şi formei legăturii prin metode analitice de studiere a legăturilor (stabilirea celor mai potrivite modele de regresie) 5.1.1.1. Analiza regresiei şi corela iei 5.1.2.1. Tipuri de legături 5.4. Metoda corela iei 5.1. Analiza regresiei folosind SPSS 5. Metode de studiere a legăturilor dintre fenomene 5.

.

programul oferă posibilită i diverse de gestionare a datele (selectare. Chart Editor şi Pivot Table. .spv. 5 . Site-ul oficial românesc pe care se găsesc informa ii valoroase despre SPSS este www.spss.1. de informare despre metadatele variabilelor dar şi de organizare a rezultatelor după preferin ele utilizatorului. Prima versiune de program a fost creată în anul 1968 ajungându-se astăzi la versiunea 17.ro. sănătate etc. astfel că programul este utilizat astăzi în marketing. psihologie. creare de date noi). Produsele şi modulele SPSS Programul SPSS (Statistical Package for the Social Sciences – Pachet de analize statistice pentru ştiin e sociale) este unul dintre cele mai utilizate software în analiza datelor statistice.sav. Viewer. Varietatea de domenii în care se aplică acest software s-a extins de la o versiune la alta. recodare.Capitolul 1 . fişiere de tip . Pe lângă analizele statistice. Text Output Editor. Cuvinte cheie: ferestre: Data Editor (Data View şi Variable View).No iunile de bază ale aplica iei SPSS Capitolul 1 – No iunile de bază ale aplica ie SPSS ________________________________________________________________________ Obiective Capitolul de fa ă are drept principal obiectiv familiarizarea cu aplica ia SPSS. educa ie. ________________________________________________________________________ 1.

În cadrul “Statistics Family” unul dintre cele mai utilizate programe este SPSS for Windows ce poate fi folosit într-o varietate de domenii. oferă mai multe tipuri de produse care sunt sub formă modulară.Analiza informa iilor utilizând SPSS Compania SPSS Inc. trasformarea datelor. precum şi prelucrarea şi analiza statistică a acestora folosind următoarele metode: 6 . astfel încât fiecare utilizator îşi poate achizi iona doar acele produse care îi sunt necesare. SPSS for Windows permite gestionarea datelor şi fişierelor.

Capitolul 1 .No iunile de bază ale aplica iei SPSS 7 .

0 for Windows SPSS Inc. oferă şi alte module ce permit analize mai complicate. 8 .Analiza informa iilor utilizând SPSS În concluzie principalele metode de analiză statistică ce se pot executa în SPSS for Windows sunt: Pe lângă modulul de bază SPSS 16.

0 (notă: pentru această lucrare s-a utilizat versiunea SPSS 16.0).1.2. market research” 1.2.ro şi sunt prezentate în continuare: Produsele de tip “Statistics Family” Produsele de tip “Data.0 -> SPSS 16. click pe butonul Start -> All Programs -> SPSS Inc. în sensul că aceasta foloseşte click-urile de mouse pe pictogramele şi meniurile din ferestre pentru a da comenzi programului. - 9 . în eventualitatea în care s-a creat un shortcut pentru program. text and web mining” Produsele de tip “Survey. Aplica ia poate fi accesată în două moduri: dublu click pe pictograma SPSS de pe Desktop.Capitolul 1 . -> SPSS 16.No iunile de bază ale aplica iei SPSS Celelalte produse oferite de SPSS se regăsesc pe site-ului www. Accesarea şi închiderea aplica iei SPSS Mediul de programare SPSS oferă o interfa ă “prietenoasă” avantajând astfel şi un utilizator începător. Prezentarea aplica iei SPSS 1. spss.

Analiza informa iilor utilizând SPSS Închiderea programului SPSS se poate face folosind una din cele 2 modalită i: click pe butonul din fereastră se execută comanda File -> Exit 10 .

grafice (Chart Editor) şi tabele (Pivot Table). În partea de jos a ferestrei găsim 2 foi de lucru: Data View şi Variable View.1. Trecerea de la o foaie la alta se face prin click cu mouse-ul pe eticheta foii respective. Pe lângă aceste 2 principale tipuri de ferestre se mai utilizează şi alte ferestre specializate în editarea de text (Text Output Editor).No iunile de bază ale aplica iei SPSS 1.2. Coloanele tabelului reprezintă variabilele cercetării (var). iar rândurile tabelului sunt numerotate şi reprezintă cazurile (subiec ii sau indivizii pentru care de in date). . 1. şi este folosită pentru introducerea. modificarea sau ştergerea datelor în format tabel (speadsheet).2.spv . Principalele fişiere şi ferestre din SPSS Cele mai utilizate ferestre din SPSS sunt Data Editor şi Viewer la care se ataşează fişiere de tip .2. acestea fiind active pe rând.2.sav.Capitolul 1 . ceea ce înseamnă că pe ecran apare foaia în care este plasat cursorul. 11 . Fişierul şi fereastra Data Editor Această fereastră se deschide automat atunci când lansăm SPSS-ul.

iar aceasta este un spa iu de lucru ce con ine datele brute ce trebuiesc analizate. în timp ce foaia Variable View nu con ine date.2. Fişierul şi fereastra Viewer 12 .sav 1. Datele brute şi metadatele. respectiv informa iile din fereastra Data Editor vor fi salvate sub forma unui fişier care va primi în mod automat de la aplica ia SPSS extensia . ci informa ii despre variabilele de analizat.2.Analiza informa iilor utilizând SPSS La accesarea SPSS-ului se deschide fereastra Data View.2. respectiv metadatele.

Capitolul 1 . Fereastra Pivot Table Deschiderea ferestrei Pivot Table se poate face prin 2 modalită i: clik dreapta cu mouse-ul pe tabelul din fereastra Viewer.2. alegerea din meniu a op iunii Edit Content->In Viewer (în acest caz nu se deschide o fereastră distinctă pentru tabel. 1. şi doar oferă posibilitatea de a edita în tabel) sau In separate Window (se deschide o ferestra Pivot Table ce oferă posibitatea de a face modificări mai complexe tabelului). găsim con inutul unde sunt afişate rezultatele analizei.2.No iunile de bază ale aplica iei SPSS În fereastra Viewer regăsim toate rezultatele ob inute în urma analizei statistice şi se va crea automat la prima comandă care produce ieşiri (Analyze sau Graphs). iar în al doilea cadru. Rezultatele analizei statistice respectiv informa iile din fereastra Viewer vor fi salvate sub forma unui fişier care va primi în mod automat de la aplica ia SPSS extensia . cel din dreapta ferestrei. - 13 .spv Rezultatele analizei statistice se prezintă în SPSS sub formă de tabele sau grafice. Din meniul Edit folosind comanda Edit Content->In Viewer sau In separate Window. de aceea SPSS mai are asociate încă două ferestre Pivot Table şi Chart Editor. Fereastra Viewer este structurată în două zone. lucrându-se în cadrul ferestrei Viewer. În cadrul din stânga regăsim cuprinsul sub forma unei schi e.3.

în acest caz. 14 . De men ionat ar fi că. .Analiza informa iilor utilizând SPSS Modificările făcute în tabel respectiv informa iile din fereastra Pivot Table nu vor fi salvate sub forma unui fişier ci doar în fereastra Viewer.2.din meniul Edit folosind comanda Edit Content-> In separate Window. op iunea In Viewer este inactivă. alegerea din meniu a op iunii Edit Content-> In separate Window (se deschide o ferestra Chart Editor ce oferă posibilitatea de a face modificări la grafic).clik dreapta cu mouse-ul.2. . Fereastra Chart Editor Deschiderea ferestrei Chart Editor se poate face prin 3 modalită i: .4.dublu-click pe grafic. spre deosebire de tabele. 1.

5. Salvarea şi deschiderea fişierelor de date Salvarea unui fişier se realizează prin: .2. 15 .2.comanda File -> Save sau Save As Aceste comenzi deschid fereastra Save Data As în care se pot stabili numele şi loca ia unde va fi salvat fişierul. 1.No iunile de bază ale aplica iei SPSS Modificările făcute în grafic respectiv informa iile din fereastra Chart Editor nu vor fi salvate sub forma unui fişier ci doar în fereastra Viewer.Capitolul 1 .pictograma Save din bara de instrumente .

în cazul în care acesta nu se află în folderul curent. 16 .pictograma Open din bara de instrumente .comanda File -> Open Data sau Output în func ie de tipul de fişier pe care dorim să-l deschidem (aceasta în cazul în care în prealabil s-a salvat acel fişier) Aceste comenzi deschid fereastra Open File în care este posibilă localizarea fişierului.Analiza informa iilor utilizând SPSS Deschiderea unui fişier se realizează prin: .

1. introducere date etc. Instrumentele utilizate în SPSS 1.Capitolul 1 . tipărire date şi rezultate.2. Principalele pictograme din SPSS Cele mai folosite pictograme de pe bara de instrumente atât în cazul Data Editor cât şi pentru Viewer sunt cele de salvare fişier.3. În continuare prezentăm cele mai utilizate pictograme din Data Editor (în ordinea de pe bară): 17 .No iunile de bază ale aplica iei SPSS Deschiderea unui nou fişier se realizează prin comanda File -> New Data sau Output în func ie de tipul de fişier pe care dorim să-l deschidem.3. 1.2.

Analiza informa iilor utilizând SPSS - deschiderea unui fişier salvarea fişierului tipărirea fişierului aminteşte cele mai recente dialoguri anularea ac iunii precedente revenirea la ac iunea precedentă caută anumite cazuri (rânduri) caută o anumită variabilă (coloane) oferă informa ii despre variabile caută inserează un rând inserează o coloană accesează comanda Split File accesează comanda Weight Cases aceesează comanda Select Cases arată eticheta valorii. Meniurile din SPSS Bara de meniu con ine mai multe meniuri. 18 . etc. si după cum se observă. sunt aproximativ aceleaşi pentru cele două fişiere Data Editor şi Viewer (acesta are 2 meniuri în plus Insert şi Format).2.3. 1. etc Cele mai apelate butoane din Viewer (în ordinea de pe bară): - deschiderea unui fişier salvarea fişierului tipărirea fişierului vizualizare înainte de tipărire exportă fişierul aminteşte cele mai recente dialoguri anularea ac iunii precedente revenirea la ac iunea precedentă caută anumite cazuri (rânduri) caută o anumită variabilă (coloane) oferă informa ii despre variabile accesează seturi pentru caseta de dialog Variables arată toate variabilele selectează ultimul rezultat.2.

No iunile de bază ale aplica iei SPSS În continuare prezentăm meniuri comune ale fişierelor Data Editor şi Viewer. File Acest meniu este utilizat pentru opera ii curente asupra fişierelor: creare. inserări etc. închiderea sesiunii de lucru etc.. 19 . comenzi. Edit Acest meniu este utilizat pentru editările curente pentru date numerice. deschidere. text sau obiecte grafice: copieri.Capitolul 1 . export de fişiere diverse: date. rezultate.

a liniaturii. Data Prin comenzile acestui meniu este influen at con inutul ferestrei Data Editor. a etichetei valori (valorilor li se pot ataşa denumiri explicite). 20 . Transform Acest meniu permite transformarea unor variabile (cum ar fi recodificare) şi ob inerea unor noi variabile prin calcule efectuate asupra variabilelor existente.Analiza informa iilor utilizând SPSS View Acest meniu controlează modul de afişare a uneltelor. filtrarea cazurilor. realizându-se modificări globale cum ar fi transpunerea variabilelor şi cazurilor. împăr irea bazei de date pe categorii etc.

Graphs Comenzile acestui meniu permit crearea graficelor.No iunile de bază ale aplica iei SPSS Analyze Acesta este meniul care dă acces la metodele de analiză statistică. 21 .Capitolul 1 .

Add-ons În acest meniu găsim informa ii şi un ghid on-line despre produsele. definirea unor mul imi de variabile.Analiza informa iilor utilizând SPSS Utilities În acest meniu sunt cuprinse cele mai utilizate instrumente şi permite afişarea informa iilor despre variabile. serviciile SPPS. 22 . etc.

Capitolul 1 . 23 . Help Acest meniu permite familiarizarea cu SPSS. Cele mai utilizate op iuni sunt Topics (afişează meniul în func ie de subiectul precizat de utilizator) şi Tutorial (oferă asisten ă în învă area SPSS). find o fereastră standard de ajutor.No iunile de bază ale aplica iei SPSS Window Comenzile acestui meniu asigură opera ii asupra ferestrelor precum şi controlul acestora pe ecran.

Deschide i ferestre Pivot Tabel şi Chart Editor din fişierul Viewer.spv.spss. ce fereastră s-a deschis? 6. Executa i comanda Analyze->Descriptive Statistic-> Frequencies->fereastra Frequencies: din lista sursă se trece în caseta Variable(s) variabila pentru care se va construi graficul şi se activează butonul de comandă Charts ->fereastra Frequencies Charts: butonul de op iuni Histogram. Scrie i în Data Editor foaia Data View câteva cifre pe coloane şi rânduri şi observa i ce a apărut în foaia Variabile View. Salva i şi închide i fişierul . 5.com versiunea trial cu licen ă pentru 2 săptămâni programul SPSS for Windows. Salva i fişierul . Descărca i de pe adresa de web www. 2.sav şi . 7.Analiza informa iilor utilizând SPSS Teme propuse pentru studiul individual 1.sav. Familiariza i-vă cu meniurile şi submeniurile din fişierele . 3. În urma executării acestei comenzi.spv 24 . 4. 8. Deschide i o sesiune de lucru în SPSS.

de centralizare/agregare a lor pe întreaga popula ie. Clasificarea statistică este deci o opera ie de sistematizare a unui ansamblu de elemente. număr de zecimale. pe baza atributelor comune. Recode ________________________________________________________________________ 2. în clase. sistematizarea. simultan. se stabileşte sistemul de caracteristici care permite delimitarea grupelor. tip.Sistematizarea datelor în SPSS Capitolul 2 Sistematizarea datelor în SPSS ________________________________________________________________________ Obiective Capitolul de fa ă are drept principal obiectiv în elegerea modalită ilor de introducere a datelor în SPSS. deci se alege caracteristica de grupare. În continuare.1. gruparea se face pe intervale de valori sau pe grupe de variante. Sistematizarea datelor 2. determinarea indicatorilor sintetici absolu i şi deriva i sunt metode de prelucrare primară. Cuvinte cheie: atributele variabilelor: nume. Prelucrarea primară a datelor Complexul de opera ii prin care se ob in informa iile necesare alcătuieşte prelucrarea statistică în sens larg. a claselor în “clase de clase” şi aşa 25 . Opera iile de transformare pe mai departe cu ajutorul metodelor mai evoluate ca: metoda de reparti ie uni – bi şi multidimensionala. Clasificarea şi gruparea statistică – este sistematizarea popula iei pe păr i statistic omogene. alinierea şi scala de măsurare.1.Capitolul 2 .1. obiecte. fiind necesară stabilirea intervalelor de grupare. Select Cases. Când numărul de valori/variante este mare. formează prelucrarea în sens larg. împreuna cu metodele de prelucrare primara. Opera iile de calcul ale caracteristicilor secundare derivate opera ii de grupare a datelor individuale. număr de caractere. eticheta.. a mai multor caracteristici. Gruparea/clasificarea se declanşează cu analiza teoretică a popula iei studiate în vederea stabilirii grupelor/claselor calitativ distincte şi omogene statistic. activită i. divizarea fişierelor şi selectarea subiec ilor în SPSS. în func ie de varia ia unei caracteristici sau. prezentarea datelor sub formă de tabele/serii statistice şi reprezentarea lor grafică. etc. eticheta valorilor. valorile lipsă. codificarea şi crearea datelor în SPSS. comenzile: Split File.

astfel că fiecare clasă ob inută să ocupe un loc precis. 131. 142. 135. 26 .grupări pe intervale neegale (pentru cazul unui grad foarte mare de varia ie). 142. 132. 123.grupări pe intervale egale de varia ie (se foloseşte când gradul de varia ie al caracteristicilor permite alegerea unei mărimi egale a intervalelor astfel încât numărul grupelor să nu modifice forma ei de varia ie). Cerinte ale unei clasificări: -completitudine (fiecare element trebuie să apar ina unei clase). 134. stocării. 136. -omogenitate (elementele asemănătoare apar in aceleaşi clase. -unicitate (fiecare element apar ine numai unei singure clase). 133. 130.grupări pe variante (se foloseşte când numărul variantelor este redus şi centralizarea datelor se poate face pentru fiecare variantă în parte). 135. 143. 131. 135. 125. 132. 125. ex: locuin ele se pot grupa dupa numărul de camere. 135. Alegerea numărului de grupe şi stabilirea mărimii intervalului de grupare pentru caracteristicile exprimate numeric Alegerea numărului de grupe se face inând seama de scopul pentru care se foloseşte metoda grupării. 2. Ansamblul acestora este sistemul unitar de clasificări şi nomenclatoare social-economice ce func ionează la nivel macroeconomic. 123. Mai întâi trebuiesc ordonate datele pentru a ob ine frecventele de apari ie a diferitelor variante. În practica statistică se utilizează sisteme standardizate de clasificări care constituie componente de bază ale Sistemului Informa ional Economic şi sunt instrumente indispensabile pentru organizarea culegerii. iar elementele încadrate în ea să fie cat mai omogene. Exemplu: Într-o echipă de muncitori s-au înregistrat următoarele valori ale produc iei individuale (număr piese realizate de fiecare muncitor): 125. 128. iar elemente diferite – claselor diferite). În acest scop se porneşte de la amplitudinea varia iei şi de la numărul unită ilor observate. Gruparea datelor ob inute din observare Gruparea datelor după modul de varia ie pentru caracteristicile exprimate numeric: . 122. . 143. 136. 124. .Analiza informa iilor utilizând SPSS mai departe.2.1. 128. prelucrării şi analiza datelor statistice.

ea poate lua valori între limita minima xmin şi cea maximă xmax.Sistematizarea datelor în SPSS Dacă se notează caracteristica statistică după care se grupează cu “xi”. muncitori Varianta II Nr.122 = 21 Numărul de grupe (r) mărimea intervalului de grupare (k) se aleg în aşa fel încât să se cuprindă toate valorile individuale. Amplitudinea varia iei (A) = xmax – xmin Unde: xmin = 122 şi x max = 143 A =143 .Capitolul 2 . Putem efectua urmatoarele 4 variante de grupare: Varianta I Nr. Se rotunjeste întotdeauna în plus. pentru a nu rămâne unită i ale popula iei observate pe dinafară. muncitori 4 5 8 5 4 Varianta IV 121-125 126-130 131-135 136-140 41-145 Nr. Varianta III 120-124 125-129 130-134 135-139 140-144 Nr. muncitori Grupe după mărimea produselor ob inute 120-125 125-130 130-135 135-140 140-145 4 5 8 5 4 120-125 125-130 130-135 135-140 140-145 7 3 10 2 4 Nota: limita inferioară inclusă în interval Nota: Limita superioară inclusă în interval Comparând frecven ele se observă că ele diferă tocmai datorita faptului că au fost suficiente valori ale caracteristicii egale cu una din limitele intervalelor de grupare. Pentru a elimina această dificultate se fac grupări cu varia ia discontinuă în care limita inferioară a intervalului următor este deplasată cu o unitate de măsura fa ă de limita superioară a intervalului precedent. Acestea se numesc grupări pe intervale cu varia ie continuă şi întotdeauna trebuie precizat într-o notă care limita (inferioară sau superioară) se include în interval. muncitori 7 3 10 2 4 27 .

numărul de zecimale (doar pentru cele care s-au definit numerice). pe plan teritorial şi în dinamică. . alinierea şi sistemul de măsurare a variabilei (scala ordinală sau nominală). 28 . În SPSS aceasta înseamnă definirea şi introducerea datelor statistice în paginile din fişierul Data Editor: Data View şi Variable View. lă imea coloanelor. tipul acesteia.determinarea structurii colectivită ii cercetate pe tipuri calitative diferen iate în cadrul aceleiaşi colectivita i. mai întâi. 2. .stabilirea şi interpretarea legăturilor dintre fenomene şi a factorilor care le influen ează.1 Introducerea datelor Procesul de analiză statistică a datelor presupune.2. Atributele ce trebuiesc definite sunt următoarele (în ordine de la stânga la dreapta în pagina Variable View): numele variabilei. Definirea metadatelor din Variable View Aceasta este prima etapă din procesul de pregătire a bazei de date şi presupune precizarea atributelor variabilelor în pagina Variable View din Data Editor. total al observa iilor. eticheta variabilei.surprinderea tendin elor de manifestare a varia iei fenomenului studiat.1. eticheta valorilor variabilei. valorile lipsă. În exemplul luat avem: Func iile grupării statistice sunt: . în special pentru caracteristicile statistice cu tendin e de varia ie sistematică şi cu un număr mare de observa ii se poate folosi formula lui Sturges: unde N = nr. . numărul de caractere ale variabilei. opera iunea de pregătirea bazei de date.2 Introducerea şi sistematizarea datelor în SPSS 2.sesizarea muta iilor produse în structura colectivită ii statistice.Analiza informa iilor utilizând SPSS La determinarea mărimii intervalului de grupare. 2.1.2.

poate să con ină litere. $ .Capitolul 2 . astfel trebuie avut în vedere ca valorile variabilei să nu fie mai mari.Sistematizarea datelor în SPSS Numele variabilei Numele variabilei.să nu con ină spa ii sau alte simboluri folosite în SPSS Tipul variabilei Tipul variabilei se va alege din coloana Type. În caz contrar se va modifica valoarea definită implicit . Numărul de caractere al variabilei Indiferent dacă variabila este numerică sau text.să fie unic .primul caracter să fie o literă ._. variabilele pot fi de 2 feluri: numerice (Numeric) şi text (String). #. În general. Atunci când se va alege numele variabilei trebuie să ine i cont de câteva restric ii impuse de SPSS: . 29 . numărul de caractere al acesteia va fi definit în coloana Width. cifre şi anumite simboluri: @. Numărul de caractere stabilit implicit de SPSS este de 8. se va scrie în coloana Name. care vă recomandăm să fie scurt şi explicit.

şi acesta va fi afişat în Viewer.Analiza informa iilor utilizând SPSS Numărul de zecimale Dacă variabila a fost definită numerică în coloana Decimals se va opta asupra numărului de zecimale pe care îl va avea variabila. Eticheta variabilei Dacă numele variabilei trebuie să respecte anumite condi ii. Etichetele valorilor variabilei Definirea acestui atribut în coloana Value Labels este utilă în două situa ii: 30 . în coloana Label se poate preciza un nume explicit al variabilei. până la 256 caractere.

-când dorim ca variabila categorială ce pune seria pe intervale respectiv variabila a cărei valori reprezintă mijlocul intervalului. în fereastra Value Labels.Capitolul 2 . astfel se vor preciza valorile luate de variabilă şi etichetele corespunzătoare acestora. să afişeze defapt intervalele de grupare. 31 .Sistematizarea datelor în SPSS -când dorim să transformăm variabila nominală în variabilă numerică. De exemplu pentru cele două valori ale variabilei mediul – urban respectiv rural – se va executa comanda: se va scrie 1 în Value şi urban în Label -> click pe butonul Add -> scriem 2 în Value şi rural în Label -> click pe butonul Add -> click pe butonul OK.

Analiza informa iilor utilizând SPSS Valorile lipsă Există 2 tipuri de valori lipsă: system-missing values şi user-missing values. dar această valoare se poate schimba -. Când nu lipsesc valori. 32 . Lă imea coloanei Lă imea coloanei respectiv a numărului de caractere ce încap în coloane se va stabili în Columns – implicit de SPSS sunt definite un număr de 8 caractere. se alege butonul de op iuni No missing values.

Right sau Center. 33 . Ordinal sau Nominal.din care se pot alege op iunile Left. Sistemul de măsurare a variabilei Sistemul de măsurare a variabilei se va stabili în coloana Measure din care se pot aleg op iunile Scale.Capitolul 2 .Sistematizarea datelor în SPSS Alinierea valorilor Alinierea valorilor variabilei se va stabili în coloana Align .

Introducerea presupune scrierea unui număr sau a unui text folosind tastatura calculatorului în celula în care este cursorul şi are chenar îngroşat. pe fiecare rând se vor regăsii subiec ii analizei iar pe fiecare coloană o variabilă. Datele statistice se vor introduce în celulele spa iului de lucru din pagina Data View.2. în celula de pe rândul următor). Astfel.2. -tastele cu săge i de pe tastatură -tasta Tab (mută cursorul pe rând. succesiv în mai multe celule. se pot folosii mai multe modalită i de mutare a cursorului: -click în celula dorită.1. în celula de pe coloana următoare) -tasta Enter (mută cursorul pe coloană.Analiza informa iilor utilizând SPSS 2. Pentru a introduce mai multe date. 34 . Introducerea datelor în Data View Odată definite variabilele în pagina Variable View acestea vor apare în pagina Data View ca şi cap de tabel al spa iului de lucru organizat pe rânduri şi coloane.

pentru ultimul interval bifăm op iunea Range. care împart întreprinderile în 3 mari categorii: . Sistematizare şi organizarea datelor 2.întreprinderile mijlocii au numărul de salaria i între 49 de persoane şi 249 de persoane .2.Sistematizarea datelor în SPSS 2.sav. Pentru a face această transformare se va folosi comanda Transform->Recode În continuare vom recodifica variabila numărul de salari i – nr_sal din baza de date a fişierului asa. Această regruparea a numărului mediu de salaria i a presupus transformarea vechii variabile şi crearea uneia noi nr_sal_categ cu următoarele valori: Intervale 0-50 50-250 Peste 250 (250-450) Mijlocul intervalului 25 150 350 Valorile variabilei vechi Valorile variabilei noi (old values) (new value) Pentru a realiza această recodare se execută comanda: Transform-> Recode into Different Variables->fereastra Recode into Different Variable: se execută următoarele opera iuni: -selectăm variabila pe care o dorim să o recodificăm. Pornind de la recomandările emise de Eurostat privind evaluarea mărimii întreprinderii după criteriul numărului mediu de salaria i.2. ce cuprinde 300 de unită i locale active din jude ul Bacău.întreprinderile mici şi foarte mici au numărul de salaria i mai mic de 49 de persoane . 50-250 persoane şi peste 250 de persoane (limita superioară nu va fi inclusă în interval).2. value through HIGHEST iar în caseta ce a devenit activă se va scrie limita inferioară a intervalului 35 .1. şi se mută în caseta Input Variable->Output Variable -scriem numele noii variabile nr_sal_categ în caseta Name din zona Output Variable -click pe butonul Change din zona Output Variable -click pe butonul Old and New Values->fereastra Recode into Different Variables: Old and New Values: se execută următoarele opera iuni: -introducem pe rând în zona Old Value vechile valori prin 2 modalită i: .Capitolul 2 . Gruparea pe intervale a datelor În SPSS gruparea pe intervale a valorilor unei variabile numerice presupune transformarea acestei variabile în altă variabilă a cărei valori reprezintă mijlocele intervalelor de grupare.2. în exemplul nostru nr_sal. În prima casetă se va trece limita inferioară a intervalului iar în caseta a doua (de sub cuvântul through) limita superioară a intervalului .pentru primele intervale bifăm op inea Range şi astfel devin active două casete.întreprinderile mari au numărul de salaria i de peste 249 de persoane regrupăm numărul mediu de salari i în trei categorii: 0-50 persoane.

Analiza informa iilor utilizând SPSS -introducem în zona New Value caseta Value noile valori respectiv mijlocul fiecărui interval aferent ->click pe butonul Add astfel vechile valori (intervalul) şi noile valori (mijlocul intervalului) se vor transfera în caseta Old -> New -click pe butonul Continue ->fereastra Recode into Different Variables-> clik pe butonul OK Noua variabila nr_sal_categ apare în pagina Data View cu datele corespunzătoare fiecărei unită i locale active. 36 .

Capitolul 2 .Sistematizarea datelor în SPSS Se observă că aceste date sunt defapt mijlocul intervalului. iar pentru a afişa intervalul aferent mijlocului vom defini atributul Value pentru noua variabilă creată. valorile vechi valorile noi 37 .

mutăm variabila categorială nr_sal_categ în caseta Groups Based On. Realizarea acestei opera iuni se face executând comanda: Data ->Split File -> fereastra Split File: bifăm op iunea Organize output by groups.2.2. În urma acestei comenzi rezultatele analizei statistice (construirea de histograme) din Viewer sunt organizate în următoarea formă: 38 .2.sav. ce a devenit activă la bifarea op iunii->click pe butonul OK. dorim să împăr im acest fişier în trei categorii după variabila nou creată nr_sal_categ. la baza de date din asa. Organizarea datelor pe categorii Împăr irea bazei de date pe categorii după o variabilă categorială este utilă spre exemplu.Analiza informa iilor utilizând SPSS 2. atunci când dorim ca rezultatele analizei statistice din Viewer să fie organizate pe fiecare categorie a variabilei studiate. Revenind la exemplu anterior.

Sistematizarea datelor în SPSS Principalul avantajul a acestei comenzi este uşurin a în analiza statistică comparativă dintre categoriile studiate. Pentru a reveni la forma ini ială a fişierului de date se execută comnanda: Data ->Split File -> fereastra Split File: bifăm op iunea Analyze all causes. Spre exemplu dacă analizăm aceste histograme se observă că cea mai simetrică categorie de salaria i este cea a unită ilor locale active ce au numărul de salaria i între 0 şi 50 persoane.Capitolul 2 . do not create groups >click pe butonul OK 39 .

Realizarea acestei opera iuni se face executând comanda: Data -> Select Cases -> fereastra Select Cases. click pe butonul Continue -> fereastra Select Cases.3. Spre exemplu.Analiza informa iilor utilizând SPSS 2. şi click pe butonul If -> fereastră Select Cases: If. 40 . bifăm op iunea If condition is satisfied.2. click pe butonul OK.sav să rămână doar unită ile locale active din mediul urban pentru ca rezultatele analizei statistice din Viewer să se refere doar la acestea.2. valoarea 1 corespunde zonei urbane. în care se introduce condi ia de selec ie respectiv se mută variabila mediul în caseta liberă şi se scrie ‘=1’ (ecua ia matematică va avea forma mediul =1) pentru că aşa cum s-a precizat în definarea atributului Value al variabilei mediul. Selectarea datelor Organizarea datelor statistice prin selectarea doar a anumitor cazuri (unită i locale active) din baza de date poate fi utilă atunci când se doreşte ca analiza statistică să se refere doar la cazurile selec ionate. dorim ca în fişierul de date asa.

în pagina Data View cazurile anulate respectiv unită ile locale active din mediul rural.Capitolul 2 . -în coloana nou înfiin ată filter_$ valoarea etichetei variabilei este Not Selected 41 . sunt eviden iate în două moduri: -sunt tăiate prin Slash .Sistematizarea datelor în SPSS Astfel.

Pentru a reveni la forma ini ială a fişierului de date se execută comanda: Data -> Select Cases -> fereastra Select Cases: bifăm op iunea All cases.Analiza informa iilor utilizând SPSS În Viewer se observă că numărul de unită i locale active analizate este de 276 pentru că în baza de date au rămas doar acele societă i care îşi desfăşoară activitatea în mediul urban (fişierul originar are 300 de înregistrări). ->click pe butonul OK 42 .

Sistematizarea datelor în SPSS Astfel. 43 . nu mai sunt tăiate prin Slash. dar variabila filter_$ cu cele două valori rămâne în baza de date.Capitolul 2 . în pagina Data View cazurile care au fost anulate respectiv unită ile locale active din mediul rural.

să se introducă datele în SPSS . Nr.să se grupeze în 4 categorii societă ile comerciale în func ie de numărul de salaria i şi de cifra de afaceri 44 .crt. de Salariati 277 642 118 185 192 222 722 36 34 105 20 19 45 22 10 12 4 6 6 5 1 5 23 44 81 39 4 2699 110 77 48 4 2 8 30 12 18 14 7 16 Se cere: . SC 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Localitatea MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL BACAU MUNICIPIUL ONESTI MUNICIPIUL ONESTI MUNICIPIUL ONESTI MUNICIPIUL ONESTI MUNICIPIUL ONESTI MUNICIPIUL MOINESTI ORAS BUHUSI ORAS COMANESTI ORAS COMANESTI ORAS TARGU OCNA BOGDANESTI FILIPESTI LETEA VECHE MARGINENI NICOLAE BALCESCU PARJOL SASCUT ZEMES CA 286958445 120186639 20647604 17482738 17464567 16254481 15800138 11513560 9010313 5463503 4712478 2717217 1756665 1532557 988611 916253 848032 291844 276630 187275 93280 51695 2673144 2484704 2106221 1559407 188001 167746658 1971101 4773920 3977953 8142 152226 3528380 2073004 489822 470242 781272 7945656 867777 Nr.Analiza informa iilor utilizând SPSS Temă propusă pentru studiul individual Avem următoarea bază de date ce con ine informa ii privind sediul. cifra de afaceri şi numărul de salaria i pentru 40 de societă i comerciale.

în func ie de scopul prelucrării sau al analizei statistice. Bar.Capitolul 3 . Cele mai des întâlnite sunt: Tabele simple sunt cele în care se prezintă indicatorii statistici ai unitatilor statistice la care se referă datele. Subiectul tabelului este constituit din colectivitatea la care se referă datele şi se regăseşte de obicei în titlul general al tabelului.Prezentarea datelor în SPSS Capitolul 3 Prezentarea datelor în SPSS _________________________________________________________________________ Obiective Capitolul de fa ă are drept principal obiectiv în elegerea şi însuşirea metodelor de prezentare a datelor în SPSS Cuvinte cheie: comenzile: Frequencies. 45 . Tabelele statistice Tabelele statistice – sunt forma de bază a oricărei prezentări. reprezentând un ansamblu de judecăti despre colectivitatea studiată şi orânduite în aşa fel încât cuvintele scrise să servească drept titluri comune pentru în elegerea con inutului expresiilor numerice. ordonate după urmatoarele criterii: cronologic. teritorial sau organizatoric. Histogram. Întocmirea acestui fel de tabele nu ridică probleme deosebite. Felurile tabelelor statistice sunt extrem de variate. Pie. Crosstabs. Scatterplot. Boxplot. a rezultatelor prelucrării datelor de eviden ă. Tabelul pe grupe se foloseşte când se aplică gruparea simplă şi se centralizează frecven ele şi valorile caracteristicilor care se găsesc într-o rela ie de dependen ă fa ă de varia ia caracteristicii de grupare. Predicatul tabelului se referă la sistemul de indicatori ce caracterizează colectivitatea prezentată în tabel. ordonarea indicatorilor făcându-se în func ie de scop.1. Line. Q -Q Plot. op iunile Summaries for groups of cases sau Summaries of Separate Variables _________________________________________________________________________ 3.

Analiza informa iilor utilizând SPSS În acest tabel subiectul este reprezentat prin grupele formate pe baza caracteristicii de grupare “x”. iar predicatul din frecven ele de apari ie ale diferitelor variante (x1. z. -interpretarea legăturilor dintre varia ia caracteristicii de grupare şi varia ia caracteristicilor care formează predicatul tabelului. x2. v) de factorii de grupare. Tabelul combinat se foloseşte când subiectul se prezintă prelucrat după varia ia a cel pu in 2 caracteristici de grupare (x. 46 . v. y) şi predicatul este format din valorile centralizate ale variabilelor dependente (z. Tabelul pe grupe poate fi folosit pentru: -caracterizarea independentă a gradului şi formei de varia ie a caracteristicii x. -pentru aplicarea metodelor de calcul ale corela iei statistice. condi ionate de varia ia valorilor variabilei x. … xm) şi din sumele par iale ale valorilor înregistrate pentru caracteristicile y.

Capitolul 3 . y2 pentru grupele formate pe baza varia iei predicatului. iar grupele formate după varia ia caracteristicii y elementele componente ale predicatului. y. -completarea tuturor rubricilor tabelului. În rubricile tabelului se trec frecven ele valorilor x. -alegerea unită ilor de măsură în care se exprima indicatorii statistici. cât şi cu cele după y . y) şi au fost centralizate numai frecven ele de apari ie ale valorilor x. 47 . Tabelul de asocia ie se foloseşte pentru a putea prezenta într-un tabel statistic legatura dintre două caracteristici alternative. -precizarea surselor de informa ie şi redactarea notelor explicative. Într-un tabel cu dublă intrare grupele formate dupa varia ia caracteristicii x reprezintă elementele componente ale subiectului. Reguli de întocmire a tabelelor statistice: -stabilirea subiectului şi predicatului tabelului în func ie de scopul sistematizării datelor statistice. -evitarea unor tabele prea încărcate.Prezentarea datelor în SPSS Tabelul cu dublă intrare se foloseşte atunci când colectivitatea a fost împăr ită în grupe dupa varia ia a două caracteristici (x. pentru care deci numărul total al unită ilor observate (N) este egal cu suma frecventelor după x. Şi pentru subiect şi pentru predicat nu sunt decât doua variante x1. x2 pentru grupele formate pe baza varia iei subiectului şi y1. Rezultă că unită ile la care s-a facut înregistrarea datelor se distribuie atât după varia ia lui x cât şi a lui y. y.

sav . 48 .1.Analiza informa iilor utilizând SPSS 3. Tabelul pe grupe Construirea tabelului pe grupe în SPSS se realizează executând comanda: Analyse >Descriptive Statistics ->Frequencie ->fereastra Frequencies: se selectează din listă variabila pentru care dorim să construim tabelul şi se trece în caseta Variable(s).2. plecând de la fişierul deja prezentat în capitolul anterior note. click pe butonul OK. În fereastra Viewer se va ob ine Tabelul frecven elor în func ie de distribu ia studen ilor pe grupe de medii ob inute la absolvirea liceului.2. Tabelele statistice în SPSS 3.

5% din total. Cei mai mul i dintre studen i au avut o medie între 8.2. Tabelul cu dublă intrare (Crosstabs) Tabelul cu dublă intrare se ob ine executând comanda: Analyse->Descriptive Statistics >Crosstabs -> fereastra Crosstabs.80. aceştia reprezentând 12.40 şi 8. 3. 49 .20. Se recomandă ca variabila categorială independentă să se plaseze pe rânduri iar cea dependent pe coloane. ->click pe butonul OK. iar 45% dintre aceştia au ob inut o medie sub 9.20. 5 au ob inut media de absolvire la liceu între 8.80 şi 9.2. din listă alegem variabilele pe care le vom muta pe rânduri (caseta Row(s)) şi pe coloane (caseta Column(s)).Capitolul 3 .Prezentarea datelor în SPSS frecven e procentele procentele cumulate Interpretarea celor mai importante rezultate din Viewer : Din cei 40 de studen i analiza i.

50 .Analiza informa iilor utilizând SPSS În fereastra Viewer se va ob ine Tabelul cu dublă intrare ce reprezintă frecven ele par iale în func ie de distribu ia studen ilor pe grupe de medii ob inute la absolvirea liceului şi pe scorul la admitere la facultate. plecând de la fişierul deja prezentat în capitolul anterior note.sav .

atunci poate fi inclus în fraza pe care-l precede. figuri geometrice.3.80 şi 9. de gradul şi forma de varia ie dintre ei şi de scopul urmărit . dar dacă graficul face parte dintr-un text. Scara de reprezentare se alege inând seama de ordinul de mărime al indicatorilor de reprezentat. clar.80 şi scorul la admitere la facultate între 40 şi 48 puncte. 3. re ele curbilinii şi re ele suplimentare. .de regulă. Ele se întâlnesc în aproape toate sectoarele de activitate deoarece ele au calitatea de a prezenta într-o forma simplă. sectoare de cerc care servesc pentru plasarea corectă a punctelor pe grafic. 3. precis şi complet şi pe cât posibil să corespundă cu titlul tabelului statistic ale cărui date le reprezintă.1. 51 . simboluri şi alte mijloace specifice. hăr i. În majoritatea cazurilor se apelează la re elele folosite pentru construirea graficului în sistemul coordonatelor rectangulare. Cei mai mul i dintre studen i au avut o medie între 8. timpul şi spa iul la care se referă datele reprezentate şi unitatea de măsură. cercuri concentrice. Reprezentarea grafică a datelor Metoda grafică este folosită în teoria şi practica statistică atât pentru prezentarea unor date statistice cât şi ca instrument de analiză şi interpretare a fenomenelor studiate. Ea poate fi formată din linii paralele orizontale.40 şi 8. Notele explicative şi legendele se folosesc pentru a putea interpreta corect graficul.Prezentarea datelor în SPSS Interpretarea celor mai importante rezultate din Viewer : Din cei 40 de studen i analiza i. .00 şi scorul la admitere la facultate între 48 şi 56 puncte. Re eaua graficului are ca scop să uşureze identificarea în plan a punctelor care reprezintă mărimile variabilelor reprezentate grafic. oblice.el cuprinde indica ii cu privire la obiectul reprezentat. verticale. În reprezentarea grafică a fenomenelor social-economice se folosesc: re ele rectangulare.este indicat să fie scurt.Capitolul 3 . se trece deasupra figurii graficului. 5 au ob inut media de absolvire la liceu între 8. Graficele constau în exprimarea datelor statistice din tabele prin linii sau puncte. sugestivă şi atrăgatoare trăsăturile esen iale ale fenomenelor în condi ii determinate de timp şi spa iu. Elementele de bază ale unui grafic Titlul graficului – în el se sugerează ce rela ii trebuie interpretate vizual pe baza graficului. .3. Ele apar atunci când este necesar să se atragă aten ia asupra aspectelor metodologice ale calculării indicatorilor reprezenta i sau asupra modului de prezentare a lor în grafic.

Se folosesc în special pentru: . . 3. .cartograme şi cartodiagrame.graficele seriilor teritoriale. Se recomandă mai ales când numărul datelor reprezentate nu este prea mare şi graficul este sugestiv. Graficele prin coloane sau benzi– sunt cele mai frecvent întâlnite. Reprezentarea graficului prin coloane presupune folosirea cadranului I din sistemul axelor rectangulare. 52 .grafice prin figuri geometrice de suprafa ă sau volum. Este un grafic în care datele statistice sunt reprezentate prin figuri geometrice ca dreptunghiul. . .popularizarea datelor statistice sau a indicatorilor incluşi în programele de activitate elaborate la diferite nivele. fie pentru reprezentarea structurii colectivită ii. . Între coloane se lasă un spa iu liber egal cu aproximativ ˝din baza coloanelor. . Înăl imea coloanei este propor ionala cu valoarea indicatorilor de reprezentat. curba de concentrare.diagrame radiale (polare).diagrame de structura. Graficele prin figuri geometrice (Diagrama prin suprafete sau volum) se folosesc fie pentru reprezentările varia iei unor indicatori de volum. . Tipuri de grafice . cronograme. iar pe Ox se construiesc atâtea coloane cu bazele egale ca i indicatori sunt de reprezentat. etc. . Ele se mai pot grupa şi în func ie de felul datelor utilizate sau domeniul de folosire: . pătratul.diagrame de distribu ie (histograma. . .grafice prin figuri naturale şi simbolice. unde scara de reprezentare se fixeaza pe axa Oy.2.graficele de analiza a corela iei. curba cumulativă a frecventei. cercul. .3.graficele seriilor de distribu ie. poligon de frecven ă.pentru SCR.diagrame ale unor date par iale sau independente între ele. ale căror arii sunt direct propor ionale cu mărimile indicatorilor respectivi.Analiza informa iilor utilizând SPSS Sursa de informa ie a datelor din grafic este obligatorie în toate cazurile când se folosesc date reale.grafice prin coloane şi benzi.grafice ale seriilor cronologice (SCR).

53 . Suprafe ele sunt direct propor ionale cu volumul colectivită ii. marcat pe ordona a graficului.Capitolul 3 . Sunt reprezentate valoarea minimă şi maximă fără outlieri (valorile variabilei care depăşesc de 1. se hasureaza (coloreaza) diferit pentru fiecare grupă. iar pe axa ortodanatelor se reprezintă frecventele. Se haşureaza diferit fiecare pe cerc fiecare grupa din cadrul colectivită ii totale. Pe axa abciselor se construiesc dreptunghiuri ale căror suprafete sunt direct propor ionale cu volumul grupelor. Construc ia lui presupune. ca la aflarea medianei. Dacă avem un dreptunghi. fiecare reprezentând 25% din distribu ie. scotând în eviden ă raportul ce există între par ile componente ale colectivită ii şi colectivitatea luată ca întreg. Q3 şi mediana. ordonarea datelor şi împăr irea lor de această dată în patru grupe. a cărei înal ime este propor ională cu 100%.Prezentarea datelor în SPSS Diagramele de structură – sunt folosite frecvent în interpretarea muta iilor interGrafic în care este reprezentată structura unei colectivită i. Pe axa abciselor este reprezentat prin segmente de dreaptă mărimea intervalelor de grupare. iar par ile acesteia sunt reprezentate prin por iuni de suprafa a. exprimată prin 360° direct propor ională cu volumul colectivită ii. respectiv Q3-Q1). corespunzător procentului respectiv.5 ori intervalul interquartilic. Astfel putem folosi spre exemplu cercul de structură. Numărul de grade corespunzator sectoarelor de cerc se determina pe baza regulii de 3 simple. Q1. Boxplot – graficul medianei. Valoarea maximă Quartila 3 Mediana Quartila 1 Valoarea minimă Histograma – grafic al seriilor de reparti ie cu intervale (varia ie continua). Pe aceeaşi regula se bazeaza şi celelalte reprezentări grafice de structură. În SPSS se trasează şi curba distribu iei normale pentru a compara distribu ie observată cu cea teoretică. considerând suprafa a cercului.

Datele statistice din baza de date Se execută următoarea comandă: Graphs->Legacy Dialogs-> Bar ->fereastra Bar Charts: alegem op iunea Simple şi în caseta Data in Chart Are bifăm Values of individual cases.Line . click pe butonul Define ->fereastra Define Simple Bar .Scatterplot – graficul “nor de puncte” sau corelograma.1.Pie – graficul de structură “plăcintă” .Histograma – graficul frecven elor de apari ie pentru diferite intervale de reparti ie ale variabilei observate . organizate în principal în meniul Graphs. pe două module: Grafice define– Legacy Dialogs Grafice create– Interactive Cele mai utilizate grafice din meniul Graphs sunt următoarele: .Values of individual cases: se 54 .Boxplot – grafic folosit pentru a prezenta amplitudinea.graficul prin linie . este folosită pentru a reprezenta rela iile dintre două variabile 3.4. Graficul prin bare (Bar) Acest tip de grafic poate reprezenta : 1.4.Bar – graficul prin bare .Analiza informa iilor utilizând SPSS 3. intervalul interquartilic şi mediana unei serii . Reprezentarea grafică în SPSS În SPSS găsim o multitudine de tipuri de grafice.

Capitolul 3 .Prezentarea datelor în SPSS alege din listă variabila pentru care dorim să construim graficul şi o mutăm în caseta Bar Represent -> click pe butonul OK 55 .

plecând de la fişierul deja prezentat în capitolul anterior note. Pentru a avea scrise în grafic şi valorile mediei de absolvire se va executa comanda: dublu click pe graficul din Viewer ->fereastra Chart Editor: click dreapta pe grafic şi se alege Show Data Labels . 56 .Analiza informa iilor utilizând SPSS În fereastra Viewer se va ob ine graficul prin bare ce reprezintă mediile ob inute la absolvirea liceului de cei 40 de studen i.sav .

Capitolul 3 .Prezentarea datelor în SPSS 2. Analiza datelor statistice din baza de date Se execută următoarea comandă: Graphs->Legacy Dialogs-> Bar ->fereastra Bar Charts: alegem op iunea Simple şi în caseta Data in Chart Are bifăm Summaries for groups of cases click pe butonul Define ->fereastra Define Simple Bar . 57 .Summaries for groups of cases: se alege din listă variabila pentru care dorim să construim graficul şi o mutăm în caseta Category Axis -> click pe butonul OK.

Analiza informa iilor utilizând SPSS 58 .

3.4.Prezentarea datelor în SPSS În fereastra Viewer se va ob ine graficul prin bare a cărei înăl ime reprezintă numărul de studen i care au media în intervalul aferent (s-a plecat tot de la fişierul note.Capitolul 3 .2. Graficul prin linie (Line) Acest tip de grafic poate reprezenta : 1. Datele statistice din baza de date Se execută următoarea comandă: Graphs->Legacy Dialogs->Line ->fereastra Line Charts: alegem op iunea Simple şi în caseta Data in Chart Are bifăm Values of individual cases click pe butonul Define->fereastra Define Simple Line .sav).Values of individual cases: se alege din listă variabila pentru care dorim să construim graficul şi se mută în caseta Line Represent -> click pe butonul OK. 59 .

sav. Analiza datelor statistice din baza de date Se execută următoarea comandă: Graphs->Legacy Dialogs-> Line ->fereastra Line Charts: alegem op iunea Simple şi în caseta Data in Chart Are bifăm Summaries for 60 .Analiza informa iilor utilizând SPSS În fereastra Viewer se va ob ine graficul prin linie ce reprezintă cifra de afaceri a primelor 10 unită i locale active din baza de date asa. 2. plecând de la fişierul deja prezentat în capitolul anterior.

şi o mutăm în caseta Category Axis. 61 . mean) iar variabila pentru care dorim să calculăm un indicator statistic.g. respectiv variabila de pe axa X. respectiv variabila de pe axa Y. se mută în caseta Variable-> click pe butonul OK.Summaries for groups of cases: se execută comenzile: -se alege din listă variabila pentru care dorim să construim graficul.Prezentarea datelor în SPSS groups of cases click pe butonul Define ->fereastra Define Simple Line .Capitolul 3 .în caseta Line Represents se bifează op iunea Other statistics (e. ..

4.Analiza informa iilor utilizând SPSS În fereastra Viewer se va ob ine un grafic linie ce reprezintă cifrele de afaceri medii ob inute de cele 3 categorii de unită i locale active distribuite în func ie de numărul de salaria i. Graficul “plăcintă” (Pie) Acest tip de grafic reprezintă structura după o variabilă categorială a bazei de date. 62 .Summaries for groups of cases: se alege din listă variabila categorială pentru care dorim să construim graficul şi se mută în caseta Define Slices by. Intrepretarea graficului Se observă că cifra medie de afaceri ob inută de unită ile cu peste 250 de salaria i este cu mult mai mare decât cifrele medii de afaceri realizate de unită ile cu un număr mai mic de salaria i. 3. iar în caseta Slices Represent se bifează % of cases-> click pe butonul OK. Se execută următoarea comandă: Graphs->Legacy Dialogs->Pie ->fereastra Pie Charts: în caseta Data in Chart Are alegem op iunea Summaries for groups of cases click pe butonul Define ->fereastra Define Pie .3.

sav. plecând de la fişierul deja prezentat în capitolul anterior.Capitolul 3 .Prezentarea datelor în SPSS În fereastra Viewer se va ob ine graficul plăcintă ce reprezintă distribu ia pe medii de reziden ă a unită ilor locale active din baza de date asa. 63 .

Analiza informa iilor utilizând SPSS Intrepretarea graficului Se observă că 92% din unită ile locale active îşi desfăşoară activitatea în mediul urban şi doar 8% în mediul rural. click pe butonul OK 64 . 3.4. Graficul Boxplot Boxplot-ul se poate construi executând comanda: Graphs -> Legacy Dialogs -> Boxplot-> fereastra Boxplot: alegem op iunea Simple şi în caseta Data in Chart Are bifăm Summaries of Separate Variables click pe butonul Define ->fereastra Define Simple Boxplot: Summaries of Separate Variables: se alege din listă variabila pentru care vrem să construim Boxplot-ul şi se trece în caseta Boxes Represent.4.

primul student înregistrat în baza de date 65 .Prezentarea datelor în SPSS În fereastra Viewer se va ob ine graficul boxplot ce reprezintă distribu ia ierarhică a studen ilor în func ie de scorul ob inut la admiterea la facultate.Capitolul 3 .sav. Outlier . plecând de la fişierul note.

5. comanda Graphs -> Legacy Dialogs -> Histogram -> fereastra Histogram: alegem din listă variabila pentru care dorim să construim histograma şi o trecem în caseta Variable şi bifăm op iunea Display normal curve dacă se doreşte construirea curbei distribu iei normale -> click pe butonul OK. 3. Se observă că SPSS a ales să îi distribuie pe cei 40 de studen i pe 11 intervale egale iar mărimea intervalului este de 5 puncte.Analiza informa iilor utilizând SPSS Interpretarea rezultatelor: distribu ia studen ilor după scorul ob inut este relativ omogeană cu o uşoară asimetrie spre stânga. Graficul Histogramă Histograma se poate construi executând următoarele comenzi: 1.sav.4. plecând de la fişierul note. 66 . studen ii aglomerându-se către valorile mici ale scorului. În fereastra Viewer se va ob ine histograma ce reprezintă distribu ia studen ilor în func ie de scorul ob inut la admiterea la facultate.

Prezentarea datelor în SPSS Acesta este principalul dezavantaj a comenzi din Legacy Dialogs.şi alegem una din op iunile Number of intervals şi scriem în caseta alăturată cât intervale dorim sau Width of interval şi scriem în caseta alăturată mărimea dorită a intervalului->click pe butonul OK 67 . SPSS alege în locul utilizatorului. acesta nu are nici un control asupra construiri graficului. comanda Graphs -> Legacy Dialogs -> Interactiv ->Histogram -> fereastra Create Histogram în care se fac următoarele opera iuni: pagina Assign variables: alegem din listă variabila pentru care dorim să construim histograma şi se „trage” în caseta de pe axa X pagina Histogram: în caseta Interval Size debifăm Set interval size automatically – dacă nu dorim să aleagă SPSS numărul de interval sau mărimea intervalelor . 2.Capitolul 3 .

cum a cerut utilizatorul. 68 . însă dezavantajul acestei op iuni este că nu se ştie cu exactitate care este mărimea intervalului de grupare.Analiza informa iilor utilizând SPSS În fereastra Viewer se va ob ine histograma ce reprezintă distribu ia studen ilor pe 4 intervale egale în func ie de scorul ob inut la admiterea la facultate.sav. plecând de la fişierul note. Se observă că SPSS a distribuit pe cei 40 de studen i pe 4 intervale.

sav. plecând de la fişierul note.Prezentarea datelor în SPSS am ales 4 intervale de grupare sau op inea : În fereastra Viewer se va ob ine histograma ce reprezintă distribu ia studen ilor pe intervale egale a căror mărime este de 8 puncte în func ie de scorul ob inut la admiterea la facultate. 69 .Capitolul 3 .

însă dezavantajul acestei op iuni este că nu se ştie pe câte intervale va fi pusă distribu ia. Acest grafic se ob ine executând comanda : Graphs -> Legacy Dialogs -> Interactiv >Histogram -> fereastra Create Histogram în care se fac următoarele opera iuni: . iar distribu ia studen ilor după scorul ob inut prezintă o uşoară asimetrie spre stânga. tot din Interactive Histogram se mai poate construi şi histograma frecven elor cumulate. Deasemenea. 25 din cei 40 analiza i. Interpretarea graficului: Cei mai mul i studen i. am preferat să debifăm Set interval size automatically şi alegem op iunea Width of interval (scriem în caseta alăturată mărimea dorită a intervalului)->click pe butonul OK 70 . au scorul la admitere la facultate între 48 şi 56 puncte.pagina Histogram: în caseta Interval Size.Analiza informa iilor utilizând SPSS am ales mărimea intervalului de grupare de 8 puncte Se observă că SPSS a distribuit pe cei 40 de studen i pe intervale a căror mărime este de 8 puncte.pagina Assign variables: alegem din listă variabila pentru care dorim să construim histograma frecven elor cumulate şi se „trage” în caseta de pe axa X apoi se bifează op iunea Cumulative histogram .

71 .Capitolul 3 .Prezentarea datelor în SPSS Notă: Am preferat op iunea (Width of interval) ca utilizatorul să alegă mărimea intervalului de grupare pentru că astfel va fi mai uşor de analizat rezultatele din Viewer respectiv de interpretat histograma cu frecven ele cumulate.

Construirea graficului presupune comanda: Graph -> Legacy Dialogs -> Interactive -> Scatterplot -> fereastra Create Scatterplot în care se fac următoarele opera iuni: -pagina Assign Variables: se mută. Graficul Scatterplot Acest grafic Scatterplot denumit nor de puncte sau corelogramă este utilizat în reprezentarea legăturii statistice exprimate cantitativ dintre 2 fenomene . click pe butonul OK.4. -pagina Fit alegem din caseta Method op iunea Regression. iar în caseta de pe axa Y variabila dependentă. 72 . Am utilizat datele statistice din fişierul note. ce ar trebui să existe. în caseta de pe axa X variabila independentă.sav.Analiza informa iilor utilizând SPSS Interpretarea rezultatelor: Din cei 40 de studen i analiza i 36 au ob inut un scor la admiterea la facultate de pâna la 64 de puncte .6. astfel că în fereastra Viewer se va ob ine corelograma (Scatterplot) ce va reprezinta legătura. între media ob inută la absolvirea liceului (pe care o vom considera variabila independentă) şi scorul la admitere la facultate (aceasta va fi variabila dependentă). prin tragere. 3.

Capitolul 3 .Prezentarea datelor în SPSS 73 .

directă si liniară. 74 .Analiza informa iilor utilizând SPSS Interpretarea rezultatelor: Legătura dintre media ob inută de un student la absolvirea liceu şi scorul ob inut de acesta la admiterea la facultate este puternică.

75 .N. a numărului mediu al salaria ilor bărba i şi femei în anul 2010 (mii persoane). din persoane) în anul: care: 2008 2009 2010 bărba i femei 167 159 147 75 Bihor 72 61 57 52 27 Bistrita-Nasaud 25 199 187 179 87 Cluj 92 94 92 86 41 45 Maramures 77 76 71 36 Satu Mare 35 48 44 39 20 Salaj 19 92 84 75 36 39 Alba 169 151 145 67 Brasov 78 51 48 41 21 Covasna 20 67 63 59 28 Harghita 31 131 125 115 54 61 Mures 122 116 109 52 Sibiu 57 122 111 101 50 51 Bacau 57 56 48 26 Botosani 22 165 153 137 67 70 Iasi 87 82 74 36 Neamt 38 102 100 89 42 Suceava 47 61 55 50 27 23 Vaslui 76 72 63 30 Braila 33 87 82 75 36 Buzau 39 194 187 170 78 Constanta 92 128 118 106 46 60 Galati 46 44 39 19 Tulcea 20 60 55 51 28 Vrancea 23 147 136 124 58 Arges 66 47 44 41 21 20 Calarasi 84 80 72 36 Dambovita 36 34 33 30 14 Giurgiu 16 48 48 41 19 Ialomita 22 183 180 161 76 Prahova 85 58 54 50 23 Teleorman 27 104 106 99 46 Ilfov 53 922 886 820 383 Municipiul Bucuresti 437 136 129 119 57 62 Dolj 79 80 71 27 Gorj 44 49 46 40 19 Mehedinti 21 75 67 60 28 Olt 32 85 79 73 33 40 Valcea 124 111 107 53 Arad 54 64 59 51 24 Caras-Severin 27 129 118 109 54 Hunedoara 55 217 203 187 85 Timis 102 Sursa datelor: baza de date TEMPO-Online.Capitolul 3 . a I.S.Prezentarea datelor în SPSS Temă propusă pentru studiul individual Avem următoarea bază de date ce con ine informa ii privind distribu ia pe jude e a numărului mediu de salaria i în anii 2008-2010. Numărul mediu al salaria ilor pe jude e Numărul mediu total de salaria i (mii pentru anul 2010.

Analiza informa iilor utilizând SPSS

Se cere: - să se construiască histograma şi curba distribu iei normale (prin 3 metode) pentru distribu ia pe jude e a salaria ilor din 2010.(salaria ii vor fi grupa i în 5 grupe) - să se construiască un grafic bară pentru jude ele regiunii de N-E ce reprezintă numărul de salaria i total, salaria i bărba i şi femei în anul 2010 - să se construiască un grafic line pentru jude ele regiunii de N-E ce reprezintă numărul de salaria i în anii 2008, 2009 şi 2010 - să se construiască un boxplot (prin 2 metode) pentru variabilele numărul de salaria i şi numărul de salaria i femei pentru anul 2010 - să se construiască grafic pie ce reprezintă distribu ia procentuală a primelor 10 judete pe principalele 5 categorii de salariati - să se construiască un scatterplot pentru variabilele numărul de salaria i şi numărul de salaria i femei din anul 2010.

76

Capitolul 4 – Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS

Capitolul 4 indicatori ndicatorii Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS
________________________________________________________________________ Obiective Capitolul de fa ă are drept principal obiectiv în elegerea şi însuşirea comenzilor din SPSS necesare calculării indicatorilor tendin ei centrale şi dispersiei. Cuvinte cheie: comenzile: Case Summaries, Frequencies: Statistics One-Way ANOVA şi indicatorii: Mean, Sum, Std. Deviation, Variance, Range, Minimum, Maximum, Skewness, Sum of Squares Between Groups, Sum of Squares Within Groups, Sum of Squares Total; testului F respectiv valoare Sig. ________________________________________________________________________

4.1. Mărimile medii şi indicatorii de pozi ie şi varia ie
4.1.1. Mărimi medii Mediile sunt mărimi statistice care exprimă în mod sintetic şi generalizat, ceea ce este normal, legic, esen ial, tipic, pentru toate unită ile colectivită ii distribuite după o caracteristică. Caracteristicile mediei: • se exprimă în mod sintetic (printr-o singură valoare) • are un caracter abstract (chiar dacă se măsoara în unita i de măsura concret) • este o mărime generalizată, dacă înlocuim fiecare termen cu

• sintetizează normalul (exprimă nivelul purtat de majoritatea unită ilor colectivită ii). Într-o distribu ie normală, ocupă o pozi ie centrală spre care tinde majoritatea unită ilor colectivită ii. Rezultă că este considerată speran a matematică a acestora. Ob inerea lor se face prin două opera ii: • cumularea termenilor seriei fie prin

77

Analiza informa iilor utilizând SPSS

• apoi revenirea (prin împăr ire sau radical) la un nivel reprezentativ pentru to i termenii incluşi în calcul. Mărimi medii de pozi ie se află prin depistarea termenului ce ocupă pozi ia centrală în distribu ia statistică. Mărimi medii simple se calculează în cazul seriilor statistice simple (fără frecven ă), adică pentru seriile în care variantele caracteristicii de distribu ie sunt purtate de câte o singură unitate statistică sau când frecven ele de apari ie sunt egale între ele. Mărimi medii ponderate se calculează când variantele caracteristicii au frecven e diferite (serii cu frecven ă).

1. Media aritmetică Este cea mai cunoscuta medie şi se mai numeste simplu: medie. Este principalul indicator mediu al tendintei centrale. Defini ie Media este rezultatul sintetizării într-o singură expresie numerică a tuturor nivelurilor individuale observate, ob inută prin raportarea valorii totalizate a caracteristicii la numărul total al unită ilor. Astfel, media este valoarea pe care ar purta-o fiecare unitate statistică dacă distribu ia ar fi omogenă. • medie simplă când:

unde:

• medie ponderată când:

Un alt indicator mediu utilizat este:

2. Media geometrică Spre deosebire de media aritmetică, care se bazează pe rela ii de însumare directă între termenii seriei, media geometrică se bazează pe rela ia de produs dintre ei. Media 78

folosind aceleaşi mărimi ca şi pentru caracteristica studiata. în toate cazurile când se folosesc mărimi medii şi trebuie să se interpreteze măsura în care ele sunt reprezentative pentru to i termenii individuali din care au fost calculate. Indicatorii simpli ai varia iei Indicatorii simpli ai varia iei servesc pentru a caracteriza gradul de împrăştiere a unită ilor purtătoare ale caracteristicilor înregistrate. la estimarea erorilor de selec ie. Aceasta înseamnă că. cât şi în mărimi relative. în analiza corela iei statistice şi în general. Aceşti indicatori se pot exprima atât în mărimi absolute. Ei se calculează pentru a măsura amplitudinea varia iilor şi abaterilor valorilor individuale de la media lor. Indicatorii varia iei Indicatorii varia iei şi asimetriei pot fi folosi i la caracterizarea independentă a fenomenelor. în cazul mediei geometrice. Amplitudinea absolută a varia iei (A) se calculează ca diferen ă între nivelul maxim (xmax) şi nivelul minim (xmin) al caracteristicii: 79 . dacă se înlocuiesc to i termenii seriei şi se face produsul lor. Indicatorii varia iei pot fi calcula i ca indicatori simpli şi ca indicatori sintetici.1. adică: În cazul unei serii de distribu ie de frecven ă. calculate în raport cu valoarea mediei.Capitolul 4 – Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS geometrică reprezintă acea valoare cu care.2. fiecare termen trebuie să fie luat în func ie de frecven a sa. fiecare termen se înmul eşte de un număr egal cu frecven a lui în cadrul seriei.2. deci frecven ele devin puterile la care se ridică fiecare termen: 4.1. valoarea la care se ajunge este egală cu produsul termenilor reali. 4.1.

Analiza informa iilor utilizând SPSS A = xmax – xmin În cazul unei serii de distribu ie de frecven e. nu pot exprima întreaga varia ie a unei caracteristici înregistrate. 4. Abaterile individuale absolute (di) se calculează ca diferen e între fiecare variantă înregistrată şi media aritmetică a acestora: Numai în cazul distribu iei perfect simetrice dmax. dispersia şi coeficientul de varia ie. Indicatorii sintetici ai varia iei sunt: abaterea medie liniară.1.negativ = dmax.pozitiv. A se calculează ca diferen ă între limita maxima a intervalului superior şi limita inferioară a intervalului inferior.2. “A” se foloseşte în prelucrarea statistică la alegerea nr. Indicatorii sintetici ai varia iei Pentru a sintetiza într-o singura expresie numerică întreaga varia ie a unei caracteristici trebuie să se recurgă tot la o valoare medie calculată din abaterile individuale ale variantelor de la media lor. Amplitudinea relativă a varia iei (A%) se exprimă de regulă în procente şi se calculează ca raport între amplitudinea absolută a varia iei şi nivelul mediu al caracteristicii: “A” nu este un indicator suficient de semnificativ deoarece nu ine seama decât de valorile extreme ale caracteristicii ori asupra varia iei unui fenomen influen eaza toate valorile individuale şi frecven ele lor de apari ie.2. atunci A se determină după ce s-au închis. Indicatorii simpli ai varia iei fiind calcula i pe baza rela iilor dintre doi termeni ai seriei sau între fiecare termen şi media lor. De aceea este necesar să se calculeze şi indicatorii sintetici ai varia iei care iau în considera ie toate abaterile caracteristicii. Dacă intervalele sunt deschise. de grupe şi a mărimii intervalului de grupare. abaterea medie pătratică. în mod conven ional intervalele extreme. 80 .

pentru o serie cu frecven e relative. luate în valoare absoluta. -pentru o serie simplă: -pentru o serie cu frecven e absolute: -pentru o serie cu frecven e relative exprimate în procente: σ va fi întotdeauna > abaterea medie liniară a aceleiaşi serii de date. exprimate în procente: Abaterea medie liniară prezintă dezavantajul că nu ine seama de faptul că abaterile mai mari în valoare absolută influen ează în mai mare măsură gradul de varia ie a unei caracteristici. Abaterea medie pătratică sau abaterea standard (σ ) Se calculează ca o medie pătratică din abaterile individuale ale termenilor seriei de la media lor. abaterea medie liniară = 4/5 din valoarea abaterii medii pătratice. -pentru o serie simplă: -pentru o serie de frecven e absolute: . în calculele de corela ie. σ este un indicator de bază. 81 . în compara ie cu abaterile mai mici. care se foloseşte în analiza varia iei. Atât σ cât şi se exprimă în aceleaşi unita i de măsură ca şi cele ale caracteristicii a cărei varia ie o studiază. la estimarea erorilor de selec ie.Capitolul 4 – Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS Abaterea medie liniară ( ) se calculeaza ca o medie aritmetică simplă sau ponderată din abaterile termenilor seriei de la media lor. În literatura de specialitate se apreciază că pentru o serie de distribu ie cu tendin a clară de normalitate.

Coeficientul de varia ie ( v ) se calculează ca raport între abaterea medie pătratică şi nivelul mediu al seriei. Deci se mai poate numi şi pătratul mediu al abaterilor termenilor fa ă de media lor: -pentru o serie simplă: -pentru o serie cu frecven e absolute: -pentru o serie cu frecven e relative exprimate în procente: 82 . Cu cât are o valoare mai mică. Se apreciaza că.poate lua valori între 0 şi 100. Dacă se cunoaşte numai abaterea medie liniară se poate calcula şi astfel: Se apreciaza pentru interpretare următoarele limite ale coeficientului de varia ie: Coeficientul de varia ie . Dispersia unei caracteristici se noteaza cu şi se calculeaza ca o medie aritmetică simplă sau ponderată a pătratelor abaterilor termenilor fa ă de media lor. pe grupe. în cazul unui coeficient de peste 35-40% media nu este reprezentativă şi datele trebuie să fie separate în serii componente. Deci. cu atât seria statistică este mai omogenă şi deci media este mai reprezentativă.Analiza informa iilor utilizând SPSS Pentru compararea gradului de varia ie a două sau mai multe caracteristici statistice se foloseşte coeficientul de varia ie. De obicei se exprimă sub forma de procente. în func ie de varia ia unei alte caracteristici de grupare.v . v poate fi folosit ca un test de verificare în aplicarea metodei gruparilor.

3 Mediana – Me Este acea valoare a caracteristicii unei serii ordonate crescător sau descrescător care împarte seria în 2 păr i egale: ˝ jumătate din unita i < Me .Cuantile Cuantilele sunt indicatori care descriu anumite pozi ii particulare din cazul seriilor de distribu ie. atunci termenul de la mijloc.1. 4. cuantilele de ordin “r” ( Cr ) sunt valori ale caracteristicilor urmărite care împart distribu ia observa iilor în “r” păr i egale şi au acelaşi efectiv din numărul total al unită ilor.2. 1. cealaltă jumătate ˝ > Me . 4. par de termeni. ca medie aritmetica între cei 2 termeni centrali.1.3. Din această cauza.mediana sau cuantila de ordin 2 ( r = 2 ).3.1.1. având rangul va fi valoarea Me. Deci este valoarea cea mai frecvent întâlnită. Modul( Mo ) sau dominanta Modulul (Mo) sau dominanta reprezintă valoarea caracteristicii cu frecven a de apari ie cea mai mare. Conceptul de “cuantila” indică o divizare a distribu iei observa iilor într-un număr oarecare de păr i. 2. Indicatorii medii de pozi ie 4.quartilele sau cuantilele de ordin 4 ( r = 4 ).decilele sau cuantilele de ordin 10 ( r = 10 ). În cazul unei serii de reparti ie pe intervale egale. intervalul cu frecven a redusă cea mai mare). În cazul seriilor de distribu ie cu frecven e: Calculul locului . mediana se mai numeste valoarea echiprobabilă a caracteristicii. valoarea Mo se determină prin identificarea intervalul modal (cel cu fi cea mai mare.centilele sau cuantilele de ordinul 100 ( r = 100 ). . În cazul unei serii simple: se ordoneaza crescător sau descrescător termenii: a) Dacă seria are un număr impar. (unitatea mediana) 83 . .Capitolul 4 – Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS 4. Frecvent se utilizează urmatoarele cuantile: . Cuantile de ordin superior r = 4 se calculează în cazul distribu iilor cu număr mare de grupe sau clase de valori individuale.3. . Me se determina în mod conven ional. sau în cazul seriilor de distribu ie cu intervale inegale. b) Dacă seria are un nr.3. Prin urmare.1.

atunci Cas este cuprins între 0 şi 1. cu atât asimetria este mai mică. Dacă Me > M0 seriei. uşor asimetrice sau cu tendin a pronun ată de asimetrie. 84 . Într-o serie perfect simetrica.Analiza informa iilor utilizând SPSS Dacă Intervalul median va fi considerat intervalul în care frecven ele cumulate depăşesc locul Me în serie. Pentru interpretarea asimetriei se foloseşte coeficientul de asimetrie (Cas) şi exprimă gradul de dezechilibru al unei distribu ii. Cas = zero. deci există o asimetrie pozitiva. Mediana se exprimă în unitatea de măsură a caracteristicii studiate. La interpretarea gradului de asimetrie se porneşte de la pozi ia şi valorile pe care le au cei trei indicatori ai tendin ei centrale: Media. De aceea este necesar ca pe lângă indicatorii varia iei să se calculeze şi indicatorii de asimetrie. Astfel. Asimetria În practica statisticii social-economice se pot întâlni serii de distribu ie de frecven e simetrice. O valoare mare a Cas indică o distribu ie care diferă semnificativ de o distribu ie normală. Dacă M0 > Me. deci există o asimetrie negativă. În special calculul asimetriei se bazează pe rela ia dintre Me şi M0. Me şi M0. Cas este cuprins între –1 şi 0.1. Cu cât Cas este mai mic în valoare absolută. 4. deoarece Me coincide în valoare cu M0 seriei. o serie poate fi în una din cele 3 situa ii: Gradul de reprezentativitate al mediei creşte pe măsură ce seria se apropie mai mult de distribu ia simetrică şi are un câmp mai redus de varia ie a caracteristicii.4. simetrică.

Deviation = abaterea medie pătratică .Maximum = valoarea maximă a variabilei alese .Range = amplitudinea absolută a varia iei .Sum = suma tuturor cazurilor înregistrate .Mean = media aritmetică . Determinarea mărimilor medii şi indicatorilor de pozi ie şi varia ie în SPSS În SPSS avem posibilitatea să calculăm următorii indicatori : . 85 .2. click pe butonul Statistics -> fereastra Frequencies: Statistics: bifăm în casetele de lângă indicatorii pe care dorim să-i analizăm şi click pe butonul Continue >fereastra Frequencies: debifăm op iunea Display frequency tables şi click pe butonul OK.Median =mediana .Mode = modulul .Variance = dispersia .Skewness= coeficient de asimetrie Determinarea în SPSS a mărimilor medii şi a indicatorilor de pozi ie şi varia ie aferen i unei colectivită i simple se poate face executând următoarea comandă: Analyze -> Descriptives Statistics ->Frequencies ->fereastra Frequencies: alegem din listă variabila sau variabilele pentru care dorim să calculăm indicatorii şi le trecem în caseta Variable(s).Capitolul 4 – Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS 4.Std.Quartiles = cuantilele de ordin 4 .Minimum = valoarea minimă a variabilei alese .

Analiza informa iilor utilizând SPSS În fereastra Viewer se va ob ine un tabel Statistics în care sunt determina i indicatorii tendin ei centrale şi varia ie pentru variabilele media ob inută la absolvirea liceului şi scorul la admitere la facultate.sav. din fişierul de date note. 86 .

respectiv : 9.79 (seria este plurimodală) Std.30 75 = 9.37 Variance = 0.25-> diferen a dintre cea mai mare medie de absolvire la liceu ob inută de studen ii analiza i şi cea mai mică este de 1.0.Capitolul 4 – Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS Interpretarea celor mai importante rezultate pentru variabila media ob inută la absolvirea liceului : N Valid = 40 -> Analiza statistică se face având la bază 40 de înregistrări valide Missing = 0 -> Nu există valori lipsă Mean = 9.07-> există o asimetrie pozitivă moderată Range = 1.13 puncte Skewness= 0.98 -> 25% din studen i au ob inut o media de absolvire la liceu de sub 8.94 Percentiles 25 = 8.37 -> aproximativ 68% dintre studen i au media ob inută la absolvirea liceului cuprinsă într-un interval egal cu media plus sau minus valoarea abaterii medii pătratice.61 87 - .61 -> 75% din studen i au ob inut o media de absolvire la liceu de sub 9.94 -> cea mai mare medie ob inută la absolvirea liceului de studen ii analiza i este de 9. Deviation = 0.69-> cea mai mică medie ob inută la absolvirea liceului de studen ii analiza i este de 8.25 puncte Minimum= 8.29 +/.29 Median = 9.98 50 = 9.79 -> cea mai mică medie de absolvire ob inută de cei mai mul i dintre studen i este de 8.30 şi jumătate peste Mode = 8.30 -> jumătate din studen i au ob inut o media de absolvire la liceu de sub 9.69 Maximum= 9.30 -> jumătate din studen i au ob inut o media de absolvire la liceu de sub 9.13 -> dispersia serie este de 0.29 -> media de absolvire la liceu a celor 40 de studen i analiza i este de 9.

în func ie de varia ia factorilor determinan i. bazate pe regula adunării dispersiilor. Dispersia totală: Dispersia de grupă (par ială): Pentru a sintetiza într-o singură valoare varia ia întregii colectivită i se calculează media dispersiei par iale ( ): 88 . cu atât gradul de varia ie este mai mare. Din această cauză unită ile la care s-a făcut observarea trebuie împăr ite în grupe. corespunzător se vor calcula indicatorii de varia ie pentru fiecare grupă cât şi pe întreaga colectivitate. cât şi o medie a colectivită ii totale şi.Analiza informa iilor utilizând SPSS 4. Indicatorii de varia ie pe întreaga colectivitate se pot calcula fie făcând abstrac ie de faptul că ea este compusă din mai multe grupe. fie luând în calcul varia ia din interiorul grupelor şi între grupe.varia ia valorilor mediilor de grupă în jurul mediei colectivită ii totale . s-au ob inut următoarele distribu ii condi ionate de factorul de grupare.3. Dacă s-a aplicat în prealabil metoda grupării. Putem calcula 3 feluri de indicatori care să caracterizeze: . Între indicatorii de varia ie calcula i la nivelul fiecărei grupe şi cei pe întreaga colectivitate există anumite rela ii. Mărimile medii şi indicatorii varia iei pentru o colectivitate împăr ită în grupe Cu cât fenomenele sunt mai complexe. Presupunând că s-au înregistrat datele pentru o caracteristică x şi unită ile au fost împăr ite în “r” grupe. atunci se pot calcula atât indicatori ai tendin ei centrale şi varia iei pe grupe.varia ia valorilor în jurul mediei lor de grupă .varia ia valorilor în jurul mediei totale Pentru a măsura gradul de varia ie provocat de ac iunea combinată a celor 2 categorii de factori variabili se foloseşte metoda analizei dispersiei bazată pe descompunerea dispersiei.

y) şi au fost centralizate numai frecven ele de apari ie ale valorilor x.1. Într-un tabel cu dublă intrare grupele formate după varia ia caracteristicii x reprezintă elementele componente ale subiectului.construim tabelul cu dublă intrare . Construirea tabelului cu dublă intrare Aşa cum s-a prezentat în capitolul 3. y.verificarea regulii adunării dispersiilor folosind ANOVA 4. 89 .Capitolul 4 – Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS Dispersia dintre grupe se calculează pe baza abaterilor mediilor de grupă de la media colectivită ii totale şi măsoară gradul de influen ă a factorului de grupare asupra varia iei caracteristicii studiate. iar grupele formate după varia ia caracteristicii y elementele componente ale predicatului. Între cei 3 indicatori există rela ia: Dispersia colectivită ii totale = media dispersiei par iale + dispersia dintre grupe cunoscută şi sub numele de regula de adunare a dispersiilor. În rubricile tabelului se trec frecven ele valorilor x.4.calculăm mediile. dispersiile şi abaterile medii pătratice pe fiecare interval de grupare după factorul determinant . 4. Determinarea mărimilor medii şi indicatorilor varia iei pentru o colectivitate împăr ită în grupe în SPSS.4. tabelul cu dublă intrare se foloseşte atunci când colectivitatea a fost împăr ită în grupe după varia ia a două caracteristici (x. Regula adunării dispersiilor Pentru a calcula indicatorii tendin ei centrale şi ai varia iei pentru o colectivitate împăr ită în grupe parcurgem următoarele etape: . y.

iar pe coloane Column(s) cea dependentă. Observa ie: se recomandă ca pe rânduri Row(s) să fie pusă variabila categorială independentă.Analiza informa iilor utilizând SPSS Rezultă că unită ile la care s-a făcut înregistrarea datelor se distribuie atât după varia ia lui x cât şi a lui y. 90 . Tabelul cu dublă intrare se ob ine executând comanda: Analyse ->Descriptive Statistics >Crosstabs-> fereastra Crosstabs: din listă selectăm variabilele pentru care dorim să construim un tabel cu dublă intrare (aceste variabile trebuie să fie categoriale) şi le trecem în casetele Row(s) şi Column(s). după care click pe butonul OK. pentru care deci numărul total al unită ilor observate (N) este egal cu suma frecventelor după x. cât şi cu cele după y.

Observa ie: se recomandă ca în caseta Variable(s) să fie pusă variabila categorială dependentă. plecând de la fişierul deja prezentat în capitolul anterior note.sav în caseta Variable(s) s-a pus variabila dependentă scorul pe categorii iar în caseta Grouping Variables variabila independentă media pe categorii . click pe butonul Continue ->fereastra Summarize Case: se apasă pe butonul OK.2. Astfel.4. dispersiilor şi abaterilor medii pătratice pe fiecare interval de grupare după factorul determinant Pentru calcularea acestori indicatori se execută următoarea comandă: Analyze -> Reports -> Case Summaries ->fereastra Summarize Case: alegem din listă variabilele pentru care dorim să calculăm indicatorii şi le trecem în caseta Variable(s) respectiv Grouping Variables. 91 . Pe rândurile Row(s) tabelului s-a pus variabila categorială independentă media pe categorii iar pe coloane Column(s) variabila categorială dependentă scorul pe categorii.sav . se debifează op iunea Display cases şi click pe butonul Statistics -> fereastra Summary Reports: Statistics: selectăm din caseta Statistics indicatorii pe care dorim să-i analizăm şi îi trecem în caseta Cell Statistics. Între cele două variabile prezentate în tabel există o rela ie de cauzalitate pentru că frecven ele par iale se află pe diagonala tabelului cu dublă intrare şi în aceste condi ii putem calcula indicatorii de varia ie corespunzători. pornind de la fişierul note. Calcularea mediilor.Capitolul 4 – Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS În fereastra Viewer se va ob ine Tabelul cu dublă intrare ce reprezintă frecven ele par iale în func ie de distribu ia studen ilor pe grupe de medii ob inute la absolvirea liceului şi pe scorul la admitere la facultate. iar în caseta Grouping Variables cea independentă. 4.

Analiza informa iilor utilizând SPSS 92 .

0 puncte pe total -> aproximativ 68% din cei 40 de studen i analiza i au scorul la admitere cuprins într-un interval egal cu media plus sau minus valoarea abaterii medii pătratice.6 +/.4 puncte .4 de puncte.Variance = 35. în timp ce aproximativ 68% din studen ii cu media la liceu între 9. Verificarea regulii adunării dispersiilor folosind ANOVA În SPSS pentru a verifica regula adunării dispersiilor respectiv calcularea dispersiilor de grupă şi dintre grupe se execută următoarea comandă: Analyze -> Compare Means -> One-Way ANOVA ->fereastra One-Way ANOVA: alegem din listă variabilele pentru care dorim să calculăm indicatorii şi le trecem în caseta Dependent List (variabila dependentă) şi în caseta Factor (variabila independentă).4 +/.4 puncte pe total -> scorul mediu ob inut la admiterea la facultate de to i studen ii analiza i a fost de 53.60 şi 10.20 .Capitolul 4 – Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS În fereastra Viewer se va ob ine tabelul Case Summaries ce reprezintă frecven ele în func ie de distribu ia studen ilor pe grupe de medii ob inute la absolvirea liceului dar şi indicatorii aferen i scorului la admitere la facultate pentru fiecare interval de grupare.4.00 au un scor la admitere cuprins în intervalul 61.6 de puncte .N = 40 pe total-> În total au fost 40 de studen i analiza i din care cei mai mul i au ob inut o medie la absolvirea liceului între 8.60 şi 10. 93 . click pe butonul OK.3.00 ce au un scor mediu la admitere de 61.3.80 şi 9.6. respectiv: 53.Std.73 puncte pe total -> dispersia seriei pe total este de 35. studen ii care au media de absolvire a liceului între 9. Interpretarea celor mai importante rezultate din output : . iar scoruri mai mari au ob inut. Deviation = 6.73 puncte 4.0 puncte. în general.Mean = 53.

pornind tot de la fişierul note. În fereastra Viewer se va ob ine următorul tabel ANOVA: Suma pătratelor abaterilor Grade de libertate Media pătratelor Valoarea F calculat Între grupe Semnifica ia testului F În interiorul grupelor 94 .sav în caseta Dependent List am pus variabila categorială dependentă scorul pe categorii iar în caseta Factor variabila categorială independentă media pe categorii .Analiza informa iilor utilizând SPSS Observa ie: în caseta Dependent List se pune variabila categorială dependentă iar în caseta Factor variabila categorială independentă. Astfel.

Capitolul 4 – Mărimile medii şi indicatorii de pozi ie şi varia ie în SPSS Interpretarea celor mai importante rezultate din output : o Sum of Squares Between Groups (suma pătratelor abaterilor între grupe) = 1173. = 0.9 puncte) o testului F respectiv valoarea Sig.4 puncte) o Sum of Squares Within Groups (suma pătratelor abaterilor de grupă) = 220. iar abaterea medie pătratică între grupe sco ând radical din dispersia între grupe (σ =5. 95 . Dispersia pe total se calculeză împăr ind Sum of Squares Total la numărul total al studen ilor analiza i. iar abaterea medie pătratică pe total sco ând radical din dispersie (σ =5.05. Dispersia între grupe se calculeză împăr ind Sum of Squares Between Groups la numărul total al studen ilor analiza i.5-> plecând de la această valoare se poate calcula dispersia şi abaterea medie pătratică între grupe.000->cu această valoare mai mică decât 0. testul F este semnificativ. iar abaterea medie pătratică din interiorul grupei sco ând radical din dispersie de grupă (σ =2.3 puncte) o Sum of Squares Total (suma pătratelor abaterilor pe total) = 1393.1-> plecând de la această valoare se poate calcula dispersia şi abaterea medie pătratică de grupă. Dispersia de grupă se calculeză împăr ind Sum of Squares Within Groups la numărul total al studen ilor analiza i.6-> plecând de la această valoare se poate calcula dispersia şi abaterea medie pătratică pe total. ceea ce înseamnă că există o diferen ă semnificativă între cele 4 grupe de medii la absolvirea liceului în raport cu nivelul scorului ob inut la admiterea la faculate.

01 9.23 9.96 8.64 9.81 9.00 9.00 8.79 8. 96 .31 9.13 9.78 9.97 8.85 8.32 9.54 9.57 9.16 9.Să se calculeze indicatorii medii ai tendin ei centrale şi ai varia iei separat pentru cele două variabile ale seriei.79 8.83 9.36 9.84 9.42 9.94 9.52 9.72 8.88 8.85 9.75 9.53 9.30 9. Nr_crt 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Media de absolvire din liceu 9.Construi i tabelul Anova pentru distribu ia bivariată prezentată în tabel.37 9.19 9.10 9.63 9.16 9.71 8. .35 9.Analiza informa iilor utilizând SPSS Temă propusă pentru studiul individual Avem următoarea bază de date ce con ine informa ii privind media de absolvire a liceului şi scorul ob inut la admitere la facultate pentru 40 de studen i.94 8.Să se calculeze indicatorii medii ai tendin ei centrale şi ai varia iei pentru distribu ia bivariată prezentată în tabel .69 Scorul la admitere 68 66 64 64 62 61 60 59 57 57 57 56 56 55 55 55 55 55 54 53 53 52 52 52 51 51 51 51 50 50 50 50 50 49 48 48 48 48 47 47 Se cere: .63 9.

varia ia variabilei rezultative (Yi) este determinată într-o anumită măsură de varia ia uneia sau a mai multor variabile factoriale (Xi). Power şi Cubic. Analiza regresiei şi corela iei Asupra fenomenelor social-economice ac ionează un număr diferit de factori principali şi secundari. Kendall. Spearman. nu orice expresie numerică poate fi rezultatul unor rela ii de la cauză la efect. Xi = variabile factoriale (numite şi variabile independente sau de cauzalitate sau variabile exogene sau variabile explicative). cu atât numărul factorilor ce-l influen ează este mai mare. Legăturile sunt specifice fenomenelor social-economice şi se manifestă în medie pentru un număr mare de cazuri şi nu pentru fiecare caz în parte. unde: Yi = variabila rezultativă (numită şi variabilă dependentă sau efect sau caracteristică endogenă sau variabilă determinată). precum şi de influen a altor factori întâmplători. Nu to i aceşti factori se pot exprima numeric însă şi.Analiza seriilor interdependente în SPSS Capitolul 5 Analiza seriilor interdependente în SPSS ________________________________________________________________________ Obiective Capitolul de fa ă are drept principal obiectiv în elegerea şi însuşirea metodelor şi comenzilor necesare analizării unor serii interdependente în SPSS. Exponential. Standardized Coefficients Beta ________________________________________________________________________ 5. factorii se asociază între ei şi uneori apar o serie de cauzalită i în lan . nu toate rela iile de cauzalitate se manifestă cu aceeaşi intensitate. esen iali şi neesen iali. în care pe lângă statistică se folosesc şi cunoştinte din alte ştiin e ce studiază acelaşi domeniu. 97 . Identificarea legăturii dintre fenomene se poate realiza numai în urma unei analize calitative multilaterale. Models: Liniar. Quadratic. Regression ->Curve Estimation şi fereastra Curve Estimation. Unstandardized Coefficients B. R Square. De asemenea.Capitolul 5 . Logarithmic. Cuvinte cheie: comenzile: Bivariate Correlations.1. Cu cât fenomenul studiat este mai complex. de asemenea. iar rela iile de cauzalitate mai dificil de identificat şi măsurat. şi indicatorii: Correlation Coefficients Pearson. în acelaşi sens. care se găsesc în legatură reciprocă. De cele mai multe ori. Astfel. Test of Significance Two-tailed sau One-tailed.

legături statistice exprimate cantitativ (numeric). (ex. b) După modul de exprimare al caracteristicilor putem avea: . ex.Analiza informa iilor utilizând SPSS e = variabila eroare (reziduu).: legătura dintre studii şi ocupa ii. iar cele dintre caracteristici calitative se mai numesc asocieri statistice. d) După forma legăturii putem avea: . . ex. considera i ca “eroare“ de modelare.: la o creştere a salariului mediu va corespunde şi o creştere a vânzării bunurilor de uz îndelungat. . hiperbola.legături concomitente (sincrone). numite şi legături de asociere. e) După timpul în care se realizează legăturile putem avea: . c) După direc ia legăturii putem întâlni: .legături statistice exprimate prin cuvinte (calitative).: o dată cu scăderea cheltuielilor materiale creşte eficien a pe unitatea de produs. .legături curbilinii (când expresia analitică a legaturii este de alt tip decât liniar: parabola.legături directe (când la creşterea valorii caracteristicii factoriale îi corespunde o creştere a valorii caracteristicii rezultative). deci găsirea în final a unei func ii matematice care să descrie cel mai bine legatura dintre variabile. .).: valoarea încasărilor la un spa iu de cazare (Yi ) în func ie de numărul locurilor de cazare (Xi). etc.legături inverse (când la o creştere a valorii caracteristicii factoriale corespunde o scădere a valorii caracteristicii rezultative sau invers). 5. se analizează volumul vânzărilor în func ie de suprafa a comercială exprimată în m2(X1) şi mărimea stocurilor (X2)). ex.legături simple (când o singură caracteristică factorială esen ială determină o caracteristică rezultativă): (ex: suprafa a comercială influen ează valoarea vânzărilor într-un magazin). Studiul regresiei urmăreşte a descrie modul în care o variabilă dependentă evoluează în func ie de modificarea uneia sau a mai multor variabile cauzale. Legăturile dintre caracteristicile numerice se mai numesc şi corela ii statistice. exponen iala. care reprezintă influen a tuturor factorilor neincluşi în model. Tipuri de legături Legăturile statistice pot fi clasificate în func ie de diferite criterii: a) După numărul caracteristicilor corelate avem: . Studierea legăturii dintre fenomene are la bază două metode: regresia şi corela ia.legături multiple (când avem mai mult de 2 caracteristici factoriale).legături liniare (când se exprimă sintetic prin ecua ia dreptei). numite şi legături de corela ie. . 98 .1.legături cu decalaj (asincrone).1. ex.

termenii se ordonează în ordinea crescătoare sau descrescătoare a variabilei independente xi.2. Putem stabili existen a. 5. c) Determinarea gradului de intensitate a legăturii cu ajutorul indicatorilor parametrici sau neparametrici ai intensită ii corela iei. d) Metoda grafică presupune reprezentarea grafică a perechilor de valori (xi. corela ia este inversă.1. Această metodă se aplică în cazul seriilor cu număr mic de variante. Dacă ambele variabile variază în acelaşi sens. sensul. Se face gruparea valorilor variabilei xi pe intervale de varia ie şi se calculează valorile corespunzătoare ale variabilei yi sub forma unei mărimi derivate (de regulă ca nivel mediu).Analiza seriilor interdependente în SPSS Metoda corela iei urmăreşte să stabilească gradul în care variabila cauzală influen ează modificarea variabilei efect. direc ia şi intensitatea legăturii. b) Metoda grupărilor statistice se foloseşte când avem un număr mare de variante. printr-o analiză logică a posibilită ilor de existen ă a unei legături între variabilele considerate. În func ie de modul de distribu ie a frecven elor în tabel se poate aprecia existenta. iar când comparăm 2 serii de spa iu sau de distribu ie. iar dacă varia ia lor este în sens diferit. b) Stabilirea sensului şi formei legăturii cu ajutorul metodelor analizei regresiei. cu atât corela ia este mai intensă. Nu trebuie pornit la studiul statistic al regresiei şi corela iei decât după ce în prealabil s-a ajuns la concluzia că pot exista rela ii de la cauză la efect în domeniul studiat.2. Se recomandă folosirea intervalelor de grupare egale şi un număr aproximativ egal de grupe pentru ambele variabile.Cu cât acestea se concentrează în jurul diagonalelor tabelului. avem o legatură directă. 99 .1. Prin compararea celor 2 serii putem eviden ia existenta şi direc ia legaturii. Metode de studiere a legăturilor dintre fenomene 5. c) Metoda tabelului de corela ie presupune gruparea simultană după ambele variabile corelate x şi y.yi). ordonăm termenii cronologic. forma şi intensitatea corela iei folosind graficul numit corelogramă.Capitolul 5 . Probleme ce trebuiesc avute în vedere la cercetarea bazată pe regresie şi corela ie a) Identificarea existen ei legăturii. Metode elementare a) Metoda seriilor statistice interdependente constă în compararea termenilor a 2 serii interdependente Xi şi Yi.1. Dacă comparăm 2 serii de timp.

dar mai slabă între cele 2 variabile corelate. 5 şi 6 = inexisten a legăturii. se estimează parametrii ecua iei de regresie pe baza metodei celor mai mici patrate şi se interpretează regresia în func ie de semnul şi valoarea lor.2. 2 şi 4 = ilustrează o rela ie strânsă între x şi y. directă.Analiza informa iilor utilizând SPSS Cu ajutorul graficului se poate constata direc ia spre care se îndreaptă mul imea (norul de puncte) cât şi apropierea punctelor fa ă de o linie sau de o curbă ce pot fi trasate pe diagramă.1. Apoi. 100 . În general pot exista următoarele situa ii: 1 şi 2 = corela ie pozitivă. Metode analitice Mai întâi se construieşte corelograma şi se găseşte cel mai bun model teoretic corespunzător legăturii dintre cele 2 variabile. valorilor crescătoare ale lui xi asociindu-li-se valori crescânde ale lui yi . inversă. 3 şi 4 = corela ie negativă. valorilor crescătoare ale lui xi li se asociază valori descrescânde pentru yi . 5. punctele fiind distribuite neuniform pe grafic.2. 1 şi 3 = o legatură.

Capitolul 5 . Parabola de gradul 3: Y=a+bx+cx2+ dx3 101 . Legături de tip parabolic Parabola de gradul 2: Y=a+bx+cx2 prezintă un punct de maxim sau de minim în func ie de semnul coeficientului de regresie “c“.Analiza seriilor interdependente în SPSS Exemple de legături statistice 1. Tipuri de legături simple liniare 2.

testarea semnifica iei acestora şi în final măsurarea intensită ii corela iei. Legături de tip hiperbolic: După ce s-a aproximat pe cale grafică func ia care coincide cel mai bine legăturii dintre cele două fenomene corelate. Parametrii a şi b vor fi estima i prin metoda celor mai mici pătrate. 102 . în cazul modelului liniar cu două variabile: Semnul parametrului “b” indică direc ia legăturii dintre cele 2 variabile corelate: Valoarea parametrului “b” arată gradul de dependen ă dintre variabile. Spre exemplu.Analiza informa iilor utilizând SPSS 3. urmează estimarea parametrilor modelului. respectiv cu cât creşte sau scade “y” la o creştere sau la o scădere a variabilei “x” cu o unitate. al cărui principiu de bază constă în minimizarea sumei pătratelor abaterilor valorilor observate fa ă de valorile calculate (teoretice).

Pearson (sistematizează analiza corela iei şi stabileşte teoria corela iei pentru 3 variabile).3. . În cazul corela iei liniare simple se calculează fie raportul (indicele) de corela ie (Rxy).cu cât are o valoare mai apropiată de 1. în timp ce în cazul legăturii de tip curbiliniu nu se poate aplica decât raportul de corela ie (Rxy). 5. cu atât legătura dintre cele două fenomene este mai strânsă. Spearman (coeficientul de corela ie a rangurilor). Rxy poate lua valori de la 0 la 1 şi se interpretează astfel: . Intensitatea legăturii se poate măsura cu ajutorul raportului de corela ie (Rxy ) sau a coeficientului de corela ie (rxy). Contribu ii deosebite în studiul corela iei au fost aduse în special de Galton (coeficientul de corela ie). Cu alte cuvinte. Pot fi considerate următoarele limite orientative pentru interpretarea intensită ii legăturii dintre două fenomene: 103 . ob inem raportul de corela ie. prin ajustare se în elege înlocuirea termenilor empirici (reali) ob inu i din observare.cu cât este mai aproape de 0. Altfel spus.Capitolul 5 . Metoda corela iei Prin metoda regresiei s-a găsit modelul matematic care corespunde cel mai bine legăturii dintre două sau mai multe fenomene din natură şi societate.Analiza seriilor interdependente în SPSS Odată ob inute valorile parametrilor a şi b se calculează valoarea ecua iei de regresie pentru fiecare valoare a caracteristicii x.1. dacă aceasta ar fi depins numai de varia ia variabilei independente “x” considerate. care arată tendin a medie de varia ie a caracteristicii rezultative. legătura este mai mică sau nu există. Yule (dezvoltă teoria corela iei multiple). stabilind cât de strânsă (intensă) este legătura dintre variabilele incluse în modelul de regresie. iar opera ia de înlocuire a termenilor reali cu valorile ecua iilor de regresie se numeşte ajustare. fie coeficientul de corela ie (rxy). cu termeni teoretici. Aceste valori ale ecua iei de regresie se mai numesc şi valori teoretice ale caracteristicii y în func ie de x. a) Calculul raportului de corela ie: Dacă extragem rădăcina pătrată din raportul de determina ie. indicator care măsoară intensitatea legăturii dintre fenomene. Metoda corela iei vine să completeze metoda regresiei. cât de mult pot varia estimările făcute pe baza analizei de regresie.

Analiza informa iilor utilizând SPSS

2 Dacă se ridică la pătrat Rxy ob inem raportul de determina ie R xy . Acesta din urmă transformat în procente ne poate spune în ce propor ie variabila xi influen ează (determină) variabila yi.

b) Calculul coeficientului de corela ie În cazul corela iei liniare, raportul de corela ie se transformă în coeficient de corela ie (rxy). Coeficientul de corela ie propus de Pearson se notează cu “rxy “ şi este dat de rela ia:

Coeficientul de corela ie poate lua valori între 0 şi +/-1 şi se interpretează astfel: - între (-1;0) legătura dintre cele două variabile este de sens invers, iar intensitatea legăturii se apreciază în func ie de mărimea coeficientului, identic cu interpretarea raportului de corela ie; - dacă valoarea sa se aproprie de 0, fenomenele corelate sunt independente sau tind către independen ă; - dacă se apropie de -1 atunci legătura este foarte strânsă şi de sens invers. - între (0;+1) legătura dintre fenomenele corelate este directă şi, cu atât mai intensă cu cât se apropie de 1. Semnul lui rxy va fi acelaşi cu semnul parametrului “b” din cazul ecua iei de regresie simplă liniară, având aceeaşi semnifica ie, respectiv:

Interpretarea este similară cu cea a raportului de corela ie, iar ridicând la pătrat valoarea 2 coeficientului de corela ie ob inem coeficientul de determina ie ( rxy ),care ne arată în ce propor ie variabila independentă o determină pe cea rezultativă. Dacă în cazul legăturilor curbilinii nu se poate calcula decât raportul de corela ie, în cazul legăturilor de tip liniar pot fi calcula i ambii indicatori pentru analiza intensită ii dintre fenomene.

104

Capitolul 5 - Analiza seriilor interdependente în SPSS

5.1.4. Metode neparametrice de măsurare a legăturilor dintre fenomene Metodele analitice (parametrice) de calcul al corela iilor se utilizează în cazul în care există posibilitatea de a se determina o formă de manifestare a legăturii, verificată pentru un număr suficient de date care tind să se distribuie normal. Dar, există numeroase cazuri când distribu ia caracteristicilor nu este normală şi nici nu există informa ii despre parametrii func iilor studiate. În acest caz, nu se pot întrebuin a formulele indicatorilor analitici de corela ie, ci trebuie să se folosească alte metode pentru a putea determina existen a, direc ia şi intensitatea anumitor legături ce se stabilesc între 2 sau mai multe caracteristici. Aceste metode trebuie să elimine ipoteza privind tipul curbei de distribu ie şi să dea posibilitatea unor estimări la cele mai variate tipuri de distribu ie. Metodele prin care se rezolvă aceste probleme sunt cunoscute sub denumirea de metode neparametrice. Metodele neparametrice, pe lângă faptul că pot stabili intensitatea unei legături făcând abstrac ie de tipul de distribu ie, permit de asemenea, măsurarea intensită ii legăturilor nu numai pentru caracteristicile cantitative, dar şi pentru caracteristici calitative, deoarece în cazul metodelor neparametrice se lucrează cu un număr de ordine numit rang.

1. Tabelul de asociere şi coeficientul de asociere Această metodă se utilizează în special când unită ile purtătoare ale caracteristicilor sunt separate în 2 grupe sau sunt de forma unor caracteristici alternative (de tipul ‘’da - nu’’). Tabelul de asociere este format din 2 rânduri şi 2 coloane în care: în capetele rândurilor şi coloanelor se trec variantele celor 2 caracteristici care se supun asocia iei, iar în interiorul lui, în rubricile lui, se trec frecven ele corespunzătoare.

Produsul ad arată gradul de realizare a legăturii dintre x şi y, iar cb lipsa legăturii dintre aceste 2 caracteristici cercetate. Pentru stabilirea coeficientului de asociere care să indice existen a şi intensitatea legăturii, cea mai utilizată formulă este cea propusă de Yule.

105

Analiza informa iilor utilizând SPSS

Ca orice coeficient de corela ie şi acesta poate lua valori -1<Q<1, aratând nu numai gradul de intensitate al celor 2 caracteristici, dar şi sensul ei. Are avantajul de a se calcula uşor şi de a se folosi şi în cazul în care datele provin de la unită i statistice complexe, care în interiorul lor pot prezenta forme diferite de distribu ie, dar pot fi transformate în variabile alternative, spre exemplu: sub şi peste nivelul mediu. 2. Coeficientul de corela ie a rangurilor Rangul este o anumită treaptă de ordine a variantelor variabilei în serie. Pentru stabilirea rangurilor, valorile empirice ale variabilelor corelate sunt aşezate după mărimea lor în ordinea crescătoare sau descrescătoare. De obicei, în func ie de variabila independentă se ordonează şi variabila dependentă. Coeficien ii de corela ie ai rangurilor prezintă avantajul că ei pot fi utiliza i şi în cazul unor distribu ii asimetrice, în cazul unui număr restrâns de unită i pentru care nu se poate verifica reprezentativitatea datelor par iale sau în cazul distribu iilor unor unită i complexe. De asemenea se poate utiliza în cazul corelării fenomenelor şi caracteristicilor calitative, care prin natura lor nu se pot exprima numeric, dar pot fi ierarhizate pe baza unui anumit rang. Pornind de la ipoteza că între cele 2 serii de ranguri există concordan ă, seria a II-a care reprezintă rangurile caracteristicii rezultative ar trebui să se ordoneze şi ea tot crescător (în cazul legăturii directe) şi descrescător (dacă legatura este inversă). În cazul existentei legăturii dintre acelaşi număr de unită i care au rang mai mare sau mai mic decât ele. În cazul lipsei de legatură, ordinea de distribu ie a rangurilor celor 2 caracteristici este diferită. Similar se pot cuprinde în analiză şi distribu iile paralele ale mai multor caracteristici, cu care se pot realiza mai multe combina ii, stabilindu-se coeficien ii de corela ie ai rangurilor simpli, par iali şi multipli. Coeficien ii de corela ie ai rangului Spearman

d = diferen a de rang între caracteristicile cercetate =Rx-Ry n = numărul de unită i cercetate; Coeficientul de corela ie al rangurilor al lui Kendall

P = numărul de ranguri mai mari în continuarea rangului considerat; Q = numărul de ranguri mai mici în continuarea fiecărui rang considerat (se ia cu semn ); S = se calculează pentru rangurile variabilei dependente (y), ordonate dupa rangurile variabilei factoriale (x). Ambii coeficien i variază între [-1,1], cu aceleaşi semnifica ii. 106

în pagina Fit alegem metoda Regression. Identificarea existen ei legăturii .2.2. pe axa X variabila independentă.construirea corelogramei Construirea corelogramei sau a norului de puncte presupune construirea graficului de tip Scatterplot.1.1. estimarea parametrilor modelului şi testarea semnifica iei acestora). iar în pagina Spikes putem bifa Fit Line. 107 . prin tragere. . după care se apasă pe butonul OK.1.Analiza seriilor interdependente în SPSS 5. 5.Capitolul 5 . Analiza regresiei folosind SPSS În analiza regresiei în SPSS se parcurg următorii paşi: . Analiza regresiei şi corela iei folosind SPSS 5. în pagina Assign Variables: se mută.Stabilirea sensului şi formei legăturii prin metode analitice de studiere a legăturilor (stabilirea modelului de regresie. iar pe axa Y variabila dependentă.2. Construirea graficului presupune comanda: Graph -> Legacy Dialogs -> Interactive -> Scatterplot -> fereastra Scatteplot.Identificarea existen ei legăturii prin metoda grafică ceea ce presupune construirea corelogramei.

Analiza informa iilor utilizând SPSS În continuare se va studia legătura dintre variabila numărul de salaria i – nr_sal (variabilă independentă) şi variabila cheltuieli cu personalul – chelt_pers (variabilă dependentă).sav ce con ine 300 de unită i locale active din jude ul Bacău. Graficul Scatterplot construit în Viewer are următoarea formă: 108 . folosindu-se baza de date din fişierul asa.

presupune executarea comenzii: Analyze -> Regression ->Curve Estimation ->fereastra Curve Estimation unde executăm următoarele opera iuni: -alegem din listă variabilele numărul de salari i – nr_sal (variabilă independentă) şi cheltuieli cu personalul – chelt_pers (variabilă dependentă) şi le trecem cu ajutorul săge ii în casetele Independent Variable (variabila independentă) şi Dependent(s) (variabila dependentă) -în caseta Models bifăm tipurile de modele pentru care dorim să calculăm ecua ia de regresie (în cazul de fa ă am ales Liniar – func ia liniară. legătura dintre cele două variabile considerate a fost aproximată. directă şi foarte strânsă. utilizând SPSS. printr-o legătură simplă liniară. şi au ca efect afişarea coeficien ilor din ecua ia de regresie şi construirea graficului de aproximare a modelului. 5.se apasă butonul OK 109 .Capitolul 5 . va confirma că între numărul de salaria i şi cheltuielile cu personalul există o legătură liniară.790).2. Quadratic – func ia de gradul 2. pentru că R Sq Liniar (raportul de determina ie) ia o valoare ce se apropie de 1 (0. Logarithmic – func ia logaritmică. . iar dacă vom calcula şi raportul de corela ie (sco ând radical din R Sq Liniar) valoarea de 0. Modelul liniar de regresie ales de diagrama Scatterplot explică legătura dintre variabile. Stabilirea sensului şi formei legăturii prin metode analitice de studiere a legăturilor (stabilirea celor mai potrivite modele de regresie) Alegerea celui mai bun model de regresie.2. Exponential – func ia exponen ială) -casetele Includ constant in equation şi Plot models se bifează. Cubic – func ia de gradul 3. dar în general acestea sunt bifate implicit când se deschide fereastra.889 a acestuia.1.Analiza seriilor interdependente în SPSS Aşa cum rezultă din graficul Scatterplot.

Analiza informa iilor utilizând SPSS Rezultatele ob inute în Viewer sunt următoarele: 110 .

Analiza seriilor interdependente în SPSS 111 .Capitolul 5 .

Exponential – func ia exponen ială) -casetele Display ANOVA table. Cubic – func ia de gradul 3.970).func ia de gradul 1. Pe baza R Square din Model Summary se va decide cel mai bun model de regresie. din punctul de vedere al alegerii modelului de regresie cel mai potrivit: Se observă că în tabelul Model Summary and Parameter Estimates pentru fiecare model de regresie găsim în coloanele Model Summary raportul de determina ie (R Square) şi testarea acestuia cu testul F. iar în coloanele Parameter Estimates coeficien ii ecua iei de regresie. după care se dă click pe butonul ->fereastra Curve Estimation: se apasă pe butonul OK. -se apasă butonul Save -> fereastra Curve Estimation: Save: selectăm op iunile dorite din caseta Save Variables.971) şi Quadratic .2.func ia de gradul 2.Analiza informa iilor utilizând SPSS Interpretarea celor mai importante rezultate din output.(R Square=0. Includ constant in equation.(R Square=0. Plot models se bifează şi au ca efect testarea modelului de regresie cu ANOVA.func ia de gradul 3. Analizând tabelul se observă că cea mai mare valoare pentru R Square dintre toate modelele de regresie se înregistrează la func ia cubic . construirea graficului de aproximare a modelului. respectiv cu cât R Square se apropie mai mult de valoarea 1 cu atât acel model de regresie este mai potrivit. 112 . Logarithmic – func ia logaritmică. afişarea coeficientului aferent variabilei independente din ecua ia de regresie. 5. Quadratic – func ia de gradul 2.3.971) dar valori pentru R Square apropiate de 1: regăsim şi la func ia Liniar .1.(R Square=0. Estimarea parametrilor modelelor de regresie şi testarea semnifica iei acestora În SPSS estimarea şi testarea parametrilor unei ecua ie de regresie presupune executarea comenzii: Analyze -> Regression ->Curve Estimation ->fereastra Curve Estimation unde executăm următoarele opera iuni : -alegem din lista sursă variabilele numărul de salari i – nr_sal (variabila independentă) şi variabila cheltuieli cu personalul – chelt_pers (variabila dependentă) şi le trecem cu ajutorul săge ii în casetele Independent Variable (variabila independentă) şi Dependent(s) (variabila dependentă) -în caseta Models bifăm tipurile de modele pentru care dorim să calculăm ecua ia de regresie (în cazul de fa ă am ales Liniar – func ia liniară.

Capitolul 5 - Analiza seriilor interdependente în SPSS

Odată cu crearea rezultatelor în output, în Data Editor, în foaia Data View, găsim noile variabilele create de SPSS ca urmare a op iunilor exprimate în fereastra Curve Estimation: Save, care reprezintă valorile estimate ale variabilei dependete (FIT), valorile reziduale respectiv diferen a dintre valorile observate şi cele estimate(ERR) şi limitele inferioare şi superioare ale intervalului de încredere (LCL şi UCL) pentru fiecare model de regresie ales. 113

Analiza informa iilor utilizând SPSS

Rezultatele ob inute în Viewer sunt următoarele:

114

Capitolul 5 - Analiza seriilor interdependente în SPSS

..

115

Analiza informa iilor utilizând SPSS 116 .

adică prezintă informa ii asupra sumei pătratelor abaterilor variabilei dependente datorate modelului de regresie şi erorii de modelare (Sum of Squares).Analiza seriilor interdependente în SPSS Analizând cele mai importante rezultate din output se observă că pentru fiecare model de regresie ales sunt prezentate trei tipuri de tabele : Model Summary prezintă valoarea raportul de corela ie R.func ia de gradul 3 . gradele de libertate (df). ANOVA prezintă rezultatele analizei dispersiei variabilei dependente sub influen a variabilei factoriale şi de estimare. se confirmă că legătura dintre cele două variabile este directă şi puternică şi că cele mai potrivite modele de regresie conform lui R Square sunt cubic.05. cel mai potrivit modelul de regresie conform lui R Square. - - Revenind la exemplul nostru. valoarea ajustată a lui R Square şi eroarea standard a estima iei.). şi în această formă de prezentarea a rezultatelor. raportul de determina ie (R Square). iar în mod asemănător se pot analiza rezultatele şi pentru celelalte func ii. Dacă valoarea Sig. raportul testului F şi semnifica ia acestuia (Sig. media dispersiilor datorate celor două surse de varia ie (Mean Square). Dacă valoarea Sig. atunci parametrii modelului de regresie diferă semnificativ de valoarea zero şi modelul de regresie corespunde unei legături semnificative între cele două variabile. Error). În continuare vom interpreta rezultatele pentru modelul de regresie cubic . valorile statisticii testului t şi semnifica ia acestuia (Sig. corespunzătoare testului F este mai mică decât 0. atunci variabila independentă explică varia ia variabilei dependente drept urmare modelul de regresie corespunde unei legături între cele două variabile Coefficients prezintă coeficien ii nestandardiza i a modelului de regresie estimat (Unstandardized Coefficients B). Coeficien ii standardiza i sunt folosi i atunci când într-un model de regresie sunt mai multe variabile independente exprimate în unită i de măsură diferite.. 117 . corespunzătoare testului t este mai mică decât 0.05. quadratic şi liniar.). coeficien ii de regresie standardiza i (Standardized Coefficients Beta).Capitolul 5 . erorile standard ale acestora (Unstandardized Coefficients Std.

000x3 Dacă. deci mai mică decât 0.0.000. În concluzie pentru a alege cel mai potrivit model de regresie trebuie să se îndeplinească concomitent cele trei condi ii din tabele: 118 . se observă că pragul de semnifica ie pentru parametrii b şi d este mai mare decât 0.05. pentru a testa ipoteza conform căreia ei ar fi semnificativ diferi i de zero. Tabelul ANOVA cu valoarea Sig. directă şi puternică.05.791) ne arată că între numărul de salaria i şi cheltuielile cu personalul există o legătură de tip parabolă de gradul 3. Tabelul Coefficients cu valorile prezentate în Unstandardized Coefficients B ne ajută să scriem ecua ia de regresie pentru modelul nostru: y= a+bx+cx2+dx3 unde: a = (Constant) b = numărul de salaria i c = numărul de salaria i **2 d = numărul de salaria i **3 Deci ecua ia devine: y= -77477. se testează aceşti parametri ai ecua iei de regresie cu ajutorul testului t.144x + 2.889) şi R Square (0. ne confirmă faptul că rela ia de tip parabolă de gradul 3 dintre cele două variabile considerate este semnificativă. pentru F = 0. prin urmare cu aceşti parametri nu se poate construi o ecua ie de regresie care să definească clar o legătură semnificativă de tip parabolă de gradul 3 pentru cele două variabile.876 + 11261.622x2 .Analiza informa iilor utilizând SPSS Tabelul Model Summary cu valorile apropiate de 1 a lui R (0.

ecua ia de regresie cea mai potrivită pentru cele două variabile este cea liniară şi are următoarea formă: Y= -144640.486 + 12527.000. cheltuielile cu personalul vor creşte în medie cu 12528 lei. dintre care una este dependentă şi cealaltă independentă (factorială). pentru că R Square este mare (0. t pentru parametrii ce înso esc variabila independentă în ecua ie să fie sub 0. F mai mică decât 0. 5.05 valorile Sig.790) şi gradul de semnifica ie al testelor F şi t sunt 0. respectiv a parametrului b: la o creştere cu o persoană a numărului de salaria i.2.Capitolul 5 .2. Deci.Analiza seriilor interdependente în SPSS - un R Square mare o valoare la analiza ANOVA pentru Sig. putem afirma că cel mai potrivit model de regresie este cel liniar. quadratic şi liniar.05 Analizând tabelele aferente celorlalte 2 modele de regresie rămase în calcul.754X adică: cheltuieli cu personalul = 12528 X numărul de salaria i -144640 Interpretarea modelului de regresie liniar. Analiza corela iei folosind SPSS Pentru a stabili cât de strânsă este legăturii dintre două variabile în SPSS există posibilitatea de a calcula o corela ie bivariată respectiv de a măsurara intensitatea legăturii dintre două variabile. 119 .

sav ce con ine 300 de unită i locale active din jude ul Bacău. Rezultatele ob inute în Viewer sunt următoarele: 120 . mai departe se va studia corela ia dintre variabila numărul de salari i – nr_sal (variabila independentă) şi variabila cheltuieli cu personalul – chelt_pers (variabila dependentă). Pentru că legătura dintre cele duoă variabile este una liniară se poate calcula coeficientul de corela ie al lui Pearson. folosindu-se aceeaşi bază de date din fişierul asa. precum şi niveluri de semnifica ie corespunzătoare unui test bilateral. -în caseta Correlation Coefficients bifăm coeficientul de corela ie pe care dorim să-l calculăm (în cazul de fa ă am ales Pearson).Analiza informa iilor utilizând SPSS Pentru corela ia bivariată se pot calcula în SPSS trei coeficien i de corela ie: Pearson (atunci când există o legătură liniară simplă). Pentru analiza unei corela ii bivariate se execută comanda: Analyze -> Correlate >Bivariate ->fereastra Bivariate Correlations unde executăm următoarele opera iuni: -alegem din lista de variabile pe acelea pentru care dorim să calculăm corela ia şi le trecem cu ajutorul săge ii în caseta Variable(s). Continuând exemplul anterior. Kendall şi Spearman (atunci când se folosesc metode neparametrice de măsurare a legăturilor dintre fenomene). -click pe butonul OK .

ceea ce înseamnă că între cele două variabile există o corela ie semnificativă. ceea ce înseamnă că între variabile există o corela ie directă de intensitate medie spre puternică. în timp ce pe cealaltă diagonală a tabelului sunt valorile coeficien ilor de corela ie dintre variabile. valorile fiind distribuite de o parte şi de alta a diagonalei tabelului.05.Capitolul 5 . 121 . egală cu 0. Coeficientul de corela ie Pearson este egal cu 0.000 şi este mai mică decât 0. Valoarea Sig. Coeficien ii corela iei egali cu 1 reprezintă corela ia fiecărei variabile cu ea însăşi. (2-tailed) corespunzătoare. Testarea semnifica iei coeficientului de corela ie este realizată cu ajutorul testului t.636.Analiza seriilor interdependente în SPSS Interpretarea celor mai importante rezultate din Viewer: În tabelul Correlations este prezentată matricea coeficien ilor de corela ie.

Analiza informa iilor utilizând SPSS Temă propusă pentru studiul individual Avem următoarea bază de date ce con ine informa ii privind efectivul de studen i şi efectivul de cadre didactice la începutul anului universitar 2010/2011.S. în învă ământul public pe jude e (facem men iunea că au fost excluse filialele din teritoriu ale unor universită i). Analiza i legătura dintre cele 2 variabile (efectivul de studen i şi efectivul de cadre didactice la începutul anului universitar 2010/2011. pe jude e Jude ul Alba Arad Arges Bacau Bihor Brasov Caras-Severin Calarasi Cluj Constanta Dambovita Dolj Galati Gorj Hunedoara Iasi Maramures Mures Prahova Sibiu Suceava Timis Municipiul Bucuresti Efectiv cadre didactice 186 238 468 247 1257 852 109 9 3535 887 321 1401 572 145 260 2962 210 678 351 739 342 2038 7811 Efectiv studen i 4674 8934 10622 5319 15574 18874 3077 797 54378 22606 7758 20503 12429 4083 5241 49929 4721 9010 8246 18037 9350 33497 95161 Sursa datelor: baza de date TEMPO-Online. în învă ământul public pe jude e) şi stabili i care este cel mai potrivit model de regresie. Efectivul de studen i înscrişi la începutul anului universitar 2010/2011 şi efectivul de cadre didactice în învă ământul superior public.N. 122 . a I.

2009 “Statistică şi econometrie”. Gresoi. Editura MatrixRom.Bibliografie Bibliografie 1 Anghelache. Badea. 2008. Editura Economică. Lilea.I. Editura Economică. 1995 “Statistica teoretică”. Elisabeta. Constantin. sinteze şi studii de caz”. Editura Alma Mater. Bacău. Sorin. Elena. 1986 “Statistica”. Iaşi.. Mitru . 2008 “Analiza datelor statistice utilizând SPSS”.Roegen. Editura Economică. N. Elena. 1996 2 3 4 5 6 7 8 9 10 11 Harja. Eugenia 12 13 14 Harja. Bucureşti. Stângaciu. Emanuela Anghelache. Pavel. Bucureşti. Editura Sedcom Libris. Bucureşti. Ancu a Howitt Dennis. Iaşi. Jemna. 1998 “Statistică aplicată în economie”.elemente de statistică matematică”. Universitatea "Al. Wagner. Lilea. Bucureşti. Wagner. Capanu. Elisabeta. 2009 „Introducere în SPSS pentru Psihologie”. Eugenia (coordonator) “Statistică aplicată – indicatori. Korka.Cuza".S. 1979 “Statistică teoretică şi Economică”. Tövissi. 2006 123 15 16 17 . Eugenia Harja. 2010 şi 2011 "Changes in Romania's population distribution on localities in 1990-2007 period".. Constantin. 2004 “Anuarul statistic al jude ului Bacău”. Constantin. Edi ia a III-a. Sistem metodologic. Eugenia. Biji. Cramer Duncan Isaic-Maniu. 2004 “Statistica. Bucureşti. Bacău. Elena. 2005 “Statistică”. 2002 “Metoda statistică . Annals of the University of Oradea. Editura Univers Titu Maiorescu. Eugenia. I. Bucureşti. Isaic-Maniu.. Eugenia. Editura MatrixRom.C. Wagner. Edi iile 2007.S. Dumitru Biji. Anghelache C. Harja. Baron. Editura Alma Mater. L. Editura Universitară. 2002 “Econometrie”. Bucureşti. Editura Economică. Bucureşti. Alexandru. Al.. Editura Didactică şi Pedagogică Bucureşti. 2006 “Statistică”. Porojan. Economic Science. Ion.M. Pavel Biji. Mircea. Pavel Biji. Oana. Niculescu.. Voineagu. Sorin Gabriel. Editura Polirom. Elisabeta Jaba. Vergil Jaba. Georgescu . Bugudui. Elena Biji. 2006 “Bazele statisticii teoretice şi economice”. Dănu “Tratat de Statistică”. Bucureşti. Tudor. Elena. Editura didactică şi pedagogică. 2009. Jaba. Aplica ii”. Eugenia Harja.

Boboc. Constantin *** *** *** *** *** *** *** *** “Statistică inferen ială. Lilea. Editura Tribuna Economică. Bucureşti. Jemna. Maniu. Editura Tehnică. i an.. Elisabeta. Carmen.. Ghi ă. 2001 “Statistica macroeconomica”. Seria Psihilogie Experimentală şi aplicată. O.0”. Teste grilă şi probleme”. Voineagu. Iaşi. Dănu Jaba. 2000 “Statistica Economică”. Editura Economică. Editura Polirom. 2002 “Analiza statistică cu SPSS sub Windows”. Secareanu. Paris. Elisabeta. Ghi ă. Emilia. 1981 “Statistica pentru managementul afacerilor”. I. Simona. „Anuarul Statistic al României.prefecturabacău. 2001 “Méthodes statistiques de l'économétrie”.ro(site-ul Institutului Na ional de Statistică) http://www. 1995 “Elemente de statistică informa ională cu aplica ii”. V.Institutul Na ional de Statistică. Eugenia. C. . Bucureşti. Editura Funda iei “România de mâine”. colec ie "InfoSTAT" (colec ie) – INS Direc ia Jude eană de Statistică Bacău Baza de date TEMPO – Institutul Na ional de Statistică http://www.com (site-ul firmei SPSS Inc. Iaşi. E. Bucureşti. Vergil Onicescu.Analiza informa iilor utilizând SPSS 18 19 20 Jaba. Cristina. Vătui. Dunod.A. Grama Ana Lungu Ovidiu 21 22 23 24 Mallinvaud.. Daniela Voineagu. Emilia. Simona Voineagu. Capanu Ion.spss. Editura Sedcom Libris. Bucureşti. Mihaela Wagner Pavel. Ştefănescu. Editura Codecs. Editura Economica. 1999.insse.spss. Pintilescu.ro/portal/djs (siteul Direc iei Jude ene de Statistică Bacău) http://www. 2004 „Ghid Introductiv pentru SPSS 10. 1997. Mitru . Bucureşti. Editura Economică. Vergil. Vergil.ro (site-ul în limba română cu informa ii despre programul SPSS) http://www. i an. 1979 “Statistică – Baze teoretice şi aplica ii”. 2007 “Statistică aplicată”. Voineagu. Todose. Mariana. “Dic ionar Macmillan de Economie Moderna”.) 25 26 27 28 29 30 31 32 33 34 35 124 .

Sign up to vote on this title
UsefulNot useful