Introducere în SPSS

2011

Mihaela Naidin

INTRODUCERE

_________________________________________________________________________________________________________________

Aplicaţia SPSS („Statistical Package for the Social Sciences” – „pachet de programe statistice aplicate ştiinţelor sociale”) a fost elaborată în anul 1965 de către Universitatea Stanford din California. Programul SPSS (Statistical Package for the Social Sciences) este unul dintre cele mai utilizate în analiza statistică a datelor şi a evoluat până la versiunea 16, aria de aplicabilitate extinzându-se de la versiune la versiune, odată cu modul de operare şi cu facilităţile oferite. Programul este utilizat în foarte multe domenii: în marketing, cercetare experimentală, educaţie, sănătate etc. În afară de analizele statistice posibile, programul are componente puternice pentru managementul datelor (selectare, reconfigurare, creare de date noi) şi pentru documentarea datelor (există un dicţionar metadata, care reţine caracteristici ale datelor). Se mai poate adăuga flexibilitatea privind tipurile de date acceptate ca şi modul de construire a rapoartelor. Această carte prezintă un mod de abordare a analizei statistice folosind SPSS for Windows şi este destinată studenţilor care doresc să analizeze date din psihologie, sociologie, criminologie, sau date similare. Cartea se doreşte a fi un îndrumător pentru analiza datelor, fiind o carte completă, de sine stătătoare care satisface nevoile studenţilor la toate nivelele. Manualul este structurat pe XVII capitole, oferind astfel posibilitatea parcurgerii pas cu pas a informaţiilor prezentate dar şi o privire de ansamblu asupra procedurilor de calcul din SPSS.

1

Introducere în SPSS

2011

Mihaela Naidin

Curs 1.

I. Noţiuni de bază despre introducerea
_________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________

şi analiza statistică folosind SPSS

I.1. Accesarea SPSS-ului.
SPSS-ul for Windows este accesat în general prin folosirea butoanelor şi meniurilor folosind pentru aceasta clicuri ale mouse-ului. Astfel, cea mai rapidă modalitate de învăţare este de a urma paşii prezentaţi şi capturile de ecran. Pasul 1: Se dă dublu clic pe imagine – dacă imaginea nu apare pe ecran atunci accesaţi „Start” →Programe→SPSS.

Pasul 2: Această fereastră va apărea după câteva momente şi se pot alege oricare dintre opţiunile din fereastră.(Fereastra numeşte „Data Editor”.

se

Fereastra de editare (Data Editor) se deschide implicit la lansarea SPSS şi este folosită pentru introducerea, modificarea sau ştergerea datelor în format spreadsheet. Într-o fereastră de editare poate fi prezentat conţinutul unui fişier de date care a fost selectat dintr-o listă de fişiere creat anterior (în SPSS, Excel, Statistica etc.) sau poate fi creată o nouă foaie de lucru. Această fereastră recunoaşte fişierele de date care au extensia implicită .sav. În fereastra Data Editor sunt afişate datele de lucru. Acestea sunt aranjate în format tabel (spreadsheet), care conţine coloane şi linii. La intersecţia acestora sunt celulele (casetele, căsuţele) în care se introduc datele. La un moment dat este activă (curentă) o singură celulă, cea în care este plasat cursorul. Celula curentă este scoasă în evidenţă printr-un chenar îngroşat. Trecerea de la o celulă la alta se realizează prin clic de mouse în noua celulă sau de la tastatură cu ajutorul tastelor de control (taste săgeţi, Page Up, Page Down). 2

Introducere în SPSS

2011

Mihaela Naidin

I.2. Introducerea datelor.
Pasul 3: Aceasta este fereastra Data Editor a SPSS-ului şi este un spaţiu de lucru cu linii şi coloane în care pot fi introduse datele. Coloanele sunt folosite pentru a desemna diferite variabile. Liniile sunt cazurile sau indivizii despre care se deţin date. Pasul 4: Pentru a introduce date in SPSS se selectează una dintre celule şi se dă clic pe celula respectivă.
* În SPSS există întotdeauna o singură celulă selectată.

Pasul 5: Se introduce un număr folosind tastatura calculatorului. La apăsarea tastei „Enter” sau la selectarea cu mouse-ul a unei alte celule numărul va fi introdus în foaia de lucru la fel cum este arătat aici. Valoarea 10 este înregistrarea pentru primul rând (primul caz) al variabilei VAR00001. • Se observă că această variabilă a primit automat un nume standard. Pentru a efectua schimbarea se dă clic pe numele variabilei.

3

Introducere în SPSS

2011

Mihaela Naidin

Pasul 6: Corectarea erorilor se face folosind mouse-ul: se selectează celula unde este eroarea şi se introduce valoarea corectă. La apăsarea tastei „Enter” sau deplasarea pe o altă celulă valoarea corectată va fi introdusă.

I.3. Salvarea datelor.

Pasul 7: Selectând „File”→ „Save As” datele se vor salva sub forma unui fişier. Fişierul salvat va primi automat de la SPSS extensia „.sav”.
* Se recomandă folosirea unor nume de fişiere distincte (ex. date1) pentru a face conţinutul lor cât mai clar. Salvarea datelor este recomandat sa se facă într-un fişier diferit de cel al SPSS-ului.

Pasul 8: Pentru a alege locaţia unde va fi salvat fişierul de date, se alege calea în mediul „Save In” (se foloseşte săgeata pentru a ajunge la locaţia dorită).
Salvarea unui fişier se realizează prin pictograma Save din bara de instrumente Standard sau cu ajutorul comenzilor Save sau Save As şi meniul File. Aceste comenzi deschid fereastra Save Data As în care se pot stabili: numele fişierului (File name); tipul fişierului (Save as type); locaţia în care să aibă loc salvarea (Save In). 4

Introducere în SPSS

2011

Mihaela Naidin

I.4. Folosirea „Variabilei View” pentru crearea şi etichetarea variabilelor
Pasul 9: Apăsarea meniului „Variable View”, situat în josul paginii, schimbă fereastra „Data View” (spaţiul de lucru pentru introducerea datelor) în altă fereastră în care pot fi introduse informaţii despre variabilele create.

5

Introducere în SPSS

2011

Mihaela Naidin

Pasul 10: Acesta este spaţiul de lucru „Variable View”. În acest caz, o variabilă este deja înscrisă fiind introdusă la pasul 8. Variabila poate fi redenumită şi pot fi adăugate alte variabile destul de uşor selectând celula corespunzătoare şi tastând numele variabilei.

Aici se

modifică lăţimea coloanei. Pasul 11: La versiunea SPSS 12-16 (faţă de cele anterioare unde se permit maxim 8 caractere) nu există limită pentru lungimea numărului unei variabile. Se selectează o celulă din coloana „Name” şi se scrie un nume diferit de variabilă. Celelalte variabile vor primi valori care vor fi implicit schimbate ulterior.

Aici se modifică numărul de zecimale.

Acesta este numărul de zecimale care va apărea pe ecran.
*La editarea unei variabile trebuie să se ţină cont de următoarele restricţii: numele variabilei să fie unic, primul caracter să fie o literă, sa nu conţină simboluri speciale folosite în SPSS sau spaţii.

Pasul 12: Apare acest buton: se dă clic pe el.

6

* Fereastra de rezultate (Output Viewer) devine disponibilă automat după ce a fost efectuată o comandă de analiză a datelor. Pasul 14: Se scrie „1” în dreptul câmpului „value” şi „masculin” în dreptul câmpului „value Label”.Introducere în SPSS 2011 Mihaela Naidin Pasul 13: Va apărea această fereastră. Fereastra de sintaxă (Syntax Editor) este folosită pentru a genera programe de comenzi pe care le vom executa asupra datelor (exemplu: calculul unor noi variabile). “Chart Editor”. Fereastra de editare a rezultatelor (Text Output Editor) este folosită pentru modificarea textului rezultat. Aceste ferestre îi sunt specifice fişierele de tip . Toate rezultatele obţinute din analizele statistice sunt afişate în fereastra Output Viewer.sps. Fereastra de editare a rezultatelor (Text Output Editor) este folosită pentru modificarea textului rezultat. 2 . Apoi se apasă „Add”. Pasul 15: Aceasta operaţie de adăugare transferă informaţia în câmpul aflat dedesubt. tabele şi grafice care au asociate ferestre distincte. * La fel se procedează şi pentru introducerea celeilalte variabile (Ex. Opţiunile selectate în casetele de dialog sunt afişate în fereastra de sintaxă sub formă de comenzi. În continuare se vor urmări paşii care vor arăta cum genul biologic „masculin” şi „feminin” este introdus folosind codul „1” (masculin) respectiv „2” (feminin). sunt afişate rezultatele statistice. * Cele mai frecvent utilizate ferestre in SPSS sunt „data Editor”. „Syntax Editor” şi „Output Viewer”. sunt afişate rezultatele statistice. tabele şi grafice care au asociate ferestre distincte. În această fereastră. În această fereastră. care nu a fost afişat în tabele pivot. Fereastra de rezultate (Output Viewer) devine disponibilă automat după ce a fost efectuată o comandă de analiză a datelor. care nu a fost afişat în tabele pivot. 7 . „Pivot Table (Pivot Table Editor)”.feminin).

Se apasă butonul ► pentru a muta „vârsta” în căsuţa „Variable(s)”. Exemplu de calcul statistic. crearea unor tabele multidimensionale. legendă etc. schimbarea datelor din rânduri şi coloane. 8 . Media scorului pentru vârstă este încercuită. Acest tabel apare pentru analiza realizată anterior. Se selectează „Descriptive…” - Pasul 17: Se selectează „vârsta”. *Ferestrele în SPSS reprezintă zone de pe ecran tratate ca elemente de sine stătătoare. sub forma unei schiţe. Cadrul din stânga (cuprinsul/structura) prezintă. Pasul 16: Pentru a calcula media de vârstă se urmăresc următoarele etape: se dă clic pe „Analyze”. diagramă. Pasul 18: Fereastra „Data Editor” este înlocuită de output-ul SPSS-ului.Introducere în SPSS 2011 Mihaela Naidin Această fereastră se aseamănă cu fereastra Windows Explorer şi se deschide doar dacă s-au lansat comenzi din meniurile Statistics sau Graphs. cu caracteristici proprii. care determină acţiunile ce se pot executa în cadrul lor. adăugarea de culori. Fereastra Pivot Table (Pivot Table Editor) oferă multiple posibilităţi de modificare a tabelelor pivot: editare text.5. scale. obiectele conţinute în fereastră. ascunderea sau afişarea selectivă a rezultatelor. note şi denumirea rezultatelor statistice propriu-zise.) I. -Se selectează „Descriptive statistics”. Se dă clic pe „OK”. Fereastra Output Wiewer este structurată în două cadre/zone. Fereastra de editare a graficelor (Chart Editor) permite modificarea elementelor unui grafic (axe. Elementele din schiţă se referă la titlu.

numărul de zecimale (pentru cele numerice).  Variabile nominale sau categoriale: Sunt variabile care se măsoară clasificând cazurile în unul sau mai multe categorii. Definiţie: O variabilă este orice concept care poate fi măsurat şi care variază de la un studiu la altul. tipul. Variabilele se definesc în coloanele foii Variabile View din fereastra Data Editor. Concepte statistice esenţiale în analizele cu ajutorul SPSS-ului. simbol monetar. Scientific notation).Introducere în SPSS 2011 Mihaela Naidin I. Elementele de statistică sunt foarte simple dar apar probleme la asamblarea elementelor. valorile lipsă. Definirea presupune precizarea atributelor unei variabile: numele variabilei. alfanumerice (String).6. 9 . Această valoare indică cantitatea sau valoarea caracteristicii (variabilei) în cauză. Exemplul. date calendaristice. alinierea şi modalităţile de măsurare a variabilei. lungimea (numărul de caractere). Conceptele de bază pe care cercetătorii trebuie să le înţeleagă înainte de a trece la analizele SPSS sunt:  Variabila. abilităţile matematice având un mic rol în analiza statistică a datelor. Tipul variabilei – variabilele pot fi de mai multe tipuri: numerice (Numeric. Definirea atributelor unei variabile este prima operaţie din procesul de pregătire a setului de date. valorile etichetei. Exemplul 1: Genul biologic are două categorii: masculin şi feminin *Este foarte important să se hotărască pentru fiecare variabilă în parte dacă este variabilă nominală (categorială) sau variabilă cantitativă. Variabilele pot fi clasificate ca fiind de două tipuri:  Scoruri: Vorbim despre scoruri atunci când o valoarea numerică este atribuită unei variabile. Vârsta este o variabilă numerică deoarece valoarea –scor indică o cantitate în creştere a variabilei vârstă.  Tipurile de variabile. pentru fiecare caz în parte din eşantion. Dot. Coma. eticheta.

La o cercetare „percepţia socială asupra consumului de droguri” participă 10 persoane dintre care: 4 studenţi. al doilea subiect are vârsta de 13 ani. (a se vedea figura de mai jos). 2 profesori şi 4 elevi. al optulea subiect are vârsta de 15 ani. să se salveze fişierul creat în „My documents”cu denumirea „cercetare”. să se calculeze media de vârstă a participanţilor la studiu. 3. 10 . 22. 17 ani şi profesorii au 34 de ani şi 35 de ani. al nouălea subiect are vârsta de 10 ani şi ultimul subiect are vârsta de 13 ani. 17. 25. să se calculeze şi să se interpreteze media obţinută. al treilea subiect are vârsta de 12 ani. Salvaţi fişierul cu denumirea „subiect” pe desktop. al cincilea subiect are vârsta de 15 ani.7. al şaselea subiect are vârsta de 14 ani. Realizaţi o bază de date şi introduceţi 10 subiecţi cu vârste cuprinse între 10 şi 15 ani astfel: primul subiect are vârsta de 10 ani. elevii au 15. 2. Se cere: 1.Introducere în SPSS 2011 Mihaela Naidin I. 26 ani. Aceştia au vârste cuprinse între 15 şi 35 de ani astfel: cei 4 studenţi au 21. al patrulea subiect are vârsta de 11 ani. al şaptelea subiect are vârsta de 13 ani. Exerciţii 1. 2. 16.

Ferestrele în SPSS reprezintă: a. b. b.). permite modificarea elementelor unui grafic (axe. b. 4. În SPSS fereastra SPSS Output Viewer este utilizată pentru: a. scale. Fereastra de editare (Data Editor): a. syntax editor. e. elemente prin care i se conferă utilizatorului posibilitatea selectării unei anumite opţiuni. Care sunt cele mai frecvent utilizate ferestre în SPSS a. c. d. modificarea sau ştergerea datelor în format spreadsheet. diagramă. este folosită pentru modificarea textului rezultat. afişează rezultatele statistice. se deschide implicit la lansarea SPSS. c. elemente constitutive ale programului SPSS. syntax viewer. output editor. c. zone de pe ecran tratate ca elemente de sine stătătoare. 5. Alegeţi răspunsul corect 1. 2. data editor. output viewer. care determină acţiunile ce se pot executa în cadrul lor. cu caracteristici proprii. c. legendă etc. 3. 11 . este folosită pentru a genera programe de comenzi pe care le vom executa asupra datelor.8. b.Introducere în SPSS 2011 Mihaela Naidin I. Fereastra de rezultate (Output Viewer): a. editarea de date. este folosită pentru a genera programe de comenzi pe care le vom executa asupra datelor. care nu a fost afişat în tabele pivot. tabele şi grafice care au asociate ferestre distincte. este folosită pentru introducerea. b. d. afişarea rezultatelor.

b. dacă variabilele numerice sunt ordonate după mărime. Pentru a calcula media aritmetică alegem a. Care dintre următoarele afirmaţii este adevărată? a. b. b. să conţină spaţii sau simboluri folosite în SPSS. d. 12 . Prin apăsarea butonului “Variable View”: a. split file. Pentru a introduce date în SPSS se selectează: a. apare fereastra output. o celulă dând clic pe celula respectivă. să fie unic. d. 8. Rouge. d. editarea de date şi tabele. c. La editarea unei variabile trebuie să se ţină cont de următoarele restricţii: a. primul caracter să fie literă. c. să aibă cel puţin 8 caractere. meniul transform. meniul data. 7. modul este valoarea cu cea mai mare frecvenţă si este frecvenţa cu care apare cel mai frecvent scor. Mean. b. 11. 9. b. se schimbă fereastra “Data View”. e. SE Mean. să aibă cel mult 6 caractere. Numele variabilei trebuie să ţină cont de câteva restricţii: a. de la cea mai mică la cea mai mare. se poate introduce o variabilă diferită. primul caracter trebuie să fie o cifră. se poate repeta.Introducere în SPSS 2011 Mihaela Naidin c. c. compute. Median. 6. indicatorul “medie” reprezintă media aritmetică a unui scor şi se obţine prin însumarea valorilor şi înmulţirea cu numărul de valori. c. 10. b. poate să conţină simboluri speciale folosite în SPSS sau spaţii. c. mediana este valoarea din centrul distribuţiei. c. să conţină numai litere.

3. c. afişarea rezultatelor. o celulă dând clic pe celula respectivă. 6. primul caracter să fie literă. se schimbă fereastra “Data View”. 8. dacă variabilele numerice sunt ordonate după mărime. c. 2. a.9. cu caracteristici proprii.Introducere în SPSS 2011 Mihaela Naidin I. 4. 10. syntax editor. se deschide implicit la lansarea SPSS. e. 11. a. mean. să fie unic. a. c. data editor. c. Răspunsuri corecte 1. a. e. a. output viewer. 7. 9. tabele şi grafice care au asociate ferestre distincte. 5. afişează rezultatele statistice. mediana este valoarea din centrul distribuţiei. a. zone de pe ecran tratate ca elemente de sine stătătoare. de la cea mai mică la cea mai mare. 13 . care determină acţiunile ce se pot executa în cadrul lor . a.

1. Pasul 2: Se selectează: „Analize”. Valorile pentru ocupaţie se definesc aşa cum este descris în paşii 13-15 din capitolul I. Pentru realizarea unui tabel de frecvenţă este necesară o coloană căreia i se va da un nume. ________________________________________________________ II. Descrierea variabilelor. „Descriptive Statistics” „Frequencies…” 14 . Se etichetează valorile variabilei.Introducere în SPSS 2011 Mihaela Naidin Curs 2 II. Tabele şi diagrame. Frecvenţa procentuală. Pasul 1: Se defineşte variabila.

Diagrama circulară pentru date categoriale. A treia coloană afişează procentul de frecvenţă pentru fiecare categorie.3% din totalul de 15 persoane. 15 . 3. 2. • În ceea ce priveşte raportarea rezultatelor se prezintă numai etichetele categoriale. Prima coloană a tabelului conţine eticheta celor 5 categorii de ocupaţii. procentajul este acelaşi ca în coloana a treia. II. 4. Se apasă „OK” Pasul 4: 1.2. frecvenţele şi frecvenţele procentuale.Introducere în SPSS 2011 Mihaela Naidin Pasul 3: Se selectează ocupaţia şi se mută în partea dreaptă a tabelului aşa cum a fost descris la pasul 17 din capitolul I. Exemplu: 5 (psiholog) reprezintă 33. A patra coloană afişează procentul de frecvenţă excluzând valorile lipsă * Deoarece nu sunt valori lipsă. A cincea coloană adună procentele în josul tabelului.

Sectoarele din cerc sunt codate cu diferite culori. * Caracteristicile din această diagramă pot fi modificate cu „Chart Editor”. Se apasă „OK”.Introducere în SPSS 2011 Mihaela Naidin Pasul 1: Se selectează: „Graphs” „Pie”. Diagrama Pie este un cerc divizat în sectoare. aria acestuia fiind proporţională cu numărul de cazuri din această categorie a variabilei nominale. Fiecare sector de cerc reprezintă o categorie. Pasul 4: Acesta este felul în care apare o diagramă circulară folosind opţiunile din SPSS. 16 . Pasul 2: Se selectează „Define”. Pasul 3: Se selectează „Ocupaţia” prin apăsarea butonului ►(◄).

Se selectează „Ocupaţie” şi săgeata verde curbată în sus pentru a afişa denumirile ocupaţiilor. Adăugarea etichetelor unei diagrame circulare Pasul 1: Se dă dublu clic oriunde în dreptunghiul care conţine diagrama. Pasul 2: Se selectează „Count” şi „X”-ul roşu pentru a nu afişa. Seselectează „Apply” şi „Close”. Se procedează asemănător pentru „Procent” pentru a afişa procentajul fiecărei ocupaţii în parte. pentru a selecta „Chart Editor”. 17 . Se selectează: „Elements” „Show Data Labels”.Introducere în SPSS 2011 Mihaela Naidin II. * Diagrama de structură „pie” este folosită pentru reprezentarea frecvenţelor absolute (numere) şi/sau relative (procente) pe categorii/grupe.3.

Diagrama circulară cu sectoarele denumite şi frecvenţa procentuală afişată.Introducere în SPSS 2011 Mihaela Naidin Pasul 3: Pentru a înlătura legenda. se selectează „Options” şi „Hide Legend”. Diagrama cu bare pentru date categoriale. II.4. *Selectare unei alte variante se face prin clic cu mouse-ul pe varianta respectivă. „Simple” este preselectat. Pasul 1: Se selectează: „Graphs” „Bar…”. 18 . Pasul 2: Selectaţi „Define”.

Introducere în SPSS 2011 Mihaela Naidin Pasul 3: Se selectează ocupaţia şi se apasă butonul ► de lângă „Category Axis” pentru a introduce acolo ocupaţia. II. Se apasă „OK” Diagrama cu bare. Barele au aceeaşi bază. * Diagrama cu bare este folosită pentru a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate (Summaries for groups of cases) sau valorile medii ale diferitelor variabile pentru aceeaşi colectivitate (Summaries of separate variables). Histograme. Pe abscisă se înscrie variabila de distribuţie. egală cu unitatea. 19 . .sursa – precizează originea datelor reprezentate.5.axele de coordonate sunt folosite pentru a reprezenta variabilele. iar pe ordonată frecvenţa. iar înălţimea proporţională cu frecvenţa categoriei astfel încât aria fiecărei bare reprezintă numărul cazurilor categoriei considerate. . Diagrama prezintă atâtea bare câte categorii are o variabilă. Se selectează „% of cases”. .legenda – este folosită pentru a explica elementele din diagramă. Diagrama Bar este folosită pentru a ilustra categoriile unei distribuţii în formă convenabilă. Pentru a fi interpretat un grafic trebuie să conţină următoarele elementele: titlul graficului – oferă informaţii asupra fenomenului reprezentat (Titlul graficului coincide cu titlul tabelului de date).

Boxplot – diagrama „cutia cu mustăţi” este folosită pentru a prezenta amplitudinea. mult. Se apasă „OK”. * Pentru a schimba denumirile axelor se dă clic pe ele şi se editează. foarte puţin.Introducere în SPSS 2011 Mihaela Naidin Pentru a ilustra procesul de realizare a unei histograme vom folosi datele obţinute din răspunsurile subiecţilor la întrebarea „Vă place statistica?”. c. 20 . Alte tipuri de grafice: Line – diagrama liniară este folosită pentru a reprezenta de regulă valori medii. b. Histograma. Error Bar – diagrama „bara erorilor” este folosită pentru a arăta media şi intervalul de variabile. Puţin d. deloc). * Histograma este folosită pentru a arăta forma unei distribuţii după o variabilă înregistrată asupra unei colectivităţi (frecvenţa de apariţie pentru diferite clase de valori ale variabilei observate). Se selectează: „Graphs” „Hitogram” Pasul 2: Se selectează întrebarea „Vă place statistica?” şi se apasă butonul ►de lângă „Variable” pentru a duce întrebarea în căsuţa din dreapta. e. (răspunsuri: a. Pasul 1: Se introduc datele în „Data Editor” (aşa cum a fost prezentat la începutul capitolului). intervalul intercuartilic şi mediana unei distribuţii. Scatter – diagrama „norul de puncte” este folosită pentru a reprezenta relaţiile dintre încredere de 95% pentru media respectivă. foarte mult.

6. 17 ani şi profesorii au 34 de ani şi 35 de ani. să se realizeze tabel de frecvenţe pentru variabila „vârstă”. 5. să se realizeze un tabel de frecvenţe pentru variabila „subiecţi”. să se realizeze diagrama de bare şi histograma pentru variabila „vârstă”. 21 . Exerciţii 3. 10. să se salveze fişierul creat pe „Desktop” cu denumirea „cercetare”. 16.Introducere în SPSS 2011 Mihaela Naidin II. 25. 8. să se calculeze media pentru variabila „vârstă şi să se interpreteze. 17.6. 22. (a se vedea figura 1). Se cere: 4. 26 ani. elevii au 15. 9. Aceştia au vârste cuprinse între 15 şi 35 de ani astfel: cei 4 studenţi au 21. La o cercetare „percepţia socială asupra consumului de droguri” participă 10 persoane dintre care: 4 studenţi. să se realizeze diagrama de structură pentru variabila „subiecţi”. să se adauge etichete diagramei. 2 profesori şi 4 elevi. 7.

b. bar (diagrama de bare) şi curba frecvenţelor. Care sunt graficele folosite pentru o distribuţie după o variabilă calitativă? a. 3. b. 5. diagrama Bar si diagrama Pie b. a reprezenta valori medii. a reprezenta intervalul intercuartilic. 22 . b. a reprezenta relaţiile dintre variabile. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate. Histograma este folosită pentru: a. a prezenta amplitudinea şi mediana unei distribuţii. Alegeţi răspunsul corect 1. b.Introducere în SPSS 2011 Mihaela Naidin II. a arăta forma unei distribuţii după variabila înregistrată asupra unei colectivităţi. scatter (norul de puncte) şi histograma. d. Pentru o distribuţie după o variabilă cantitativă se folosesc următoarele grafice: a. a reprezenta grafic valorile medii ale diferitelor variabile pentru aceeaşi colectivitate.7. c. a reprezenta relaţia dintre variabile. Scatter sau Line 2. c. Diagrama de bare este folosită pentru: a. d. pie (diagrama de structută) şi line (diagrama liniară). a reprezenta relaţia dintre variabile. 4. d. d. Diagrama de structură este folosită pentru: a. c. histograma şi curba frecvenţelor. diagrama Boxplot c. a reprezenta frecvenţe absolute (numere) şi/sau relative (procente). a reprezenta frecvenţele absolute (numere) şi/sau relative (procente). c. a arăta forma unei distribuţii după o variabilă înregistrată asupra unei colectivităţi.

mediana este valoarea din centrul distribuţiei. c. graphs/ area.Introducere în SPSS 2011 Mihaela Naidin 6. analize/ descriptive statistics/descriptives. modul este valoarea cu cea mai mare frecvenţă si este frecvenţa cu care apare cel mai frecvent scor. 23 . variabile cantitative. Prima coloană a tabelului de frecvenţe conţine: a. Pentru a realiza o diagramă circulară se selectează: a. de la cea mai mică la cea mai mare. Media aritmetică se calculează pentru: a. abaterea standard b. indicatorul “medie” reprezintă media aritmetică a unui scor şi se obţine prin însumarea valorilor şi înmulţirea cu numărul de valori. Indicatorii tendinţei centrale sunt: a. 7. mod. dacă variabilele numerice sunt ordonate după mărime. abaterea standard 10. c. modul. Care dintre următoarele afirmaţii este adevărată? a. mediană c. c. etichetele categoriilor introduse. b. b. procentul de frecvenţă pentru fiecare categorie. variabile categoriale şi cantitative c. 8. variabile categoriale b. dispersie. 9. medie. b. graphs/ pie. mediana. valorile lipsă.

Răspunsuri corecte 1. c. etichetele categoriilor introduse.Introducere în SPSS 2011 Mihaela Naidin II. 7. a. medie. d. histograma şi curba frecvenţelor. b.8. c. dacă variabilele numerice sunt ordonate după mărime. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate. 6. graphs/ pie. mediană 10. mod. diagrama Bar şi diagrama Pie 2. b. mediana este valoarea din centrul distribuţiei. a arăta forma unei distribuţii după o variabilă înregistrată asupra unei colectivităţi. a. a. 5. 4. 3. c. a reprezenta frecvenţele absolute (numere) şi/sau relative (procente). 8. 24 . 9. de la cea mai mică la cea mai mare. b. variabile cantitative.

.Introducere în SPSS Curs 2 2011 Mihaela Naidin III. * Se îndepărtează cele 2 zecimale şi se scrie 0. Pasul 2: În “Data View” din “Data Editor” se introduc vârstele în prima coloană.” Pasul 4: 25 . Pasul 1: În „Variable View” din „Data Editor” se denumeşte prima coloană „Vârstă”.1. Descrierea numerică a variabilelor _________________________________________________________________________________________________________________ .Medie. Introducerea datelor şi efectuarea analizei Pentru realizarea acestui exemplu am selectat un număr de 0 subiecţi cu vârste cuprinse între 15-35 ani.. variaţie şi dispersie – III. Pasul 3: Se selectează “Analize” → “Descriptives statistics” şi “Frequencies.

Se dă clic pe „Statistics…” Pasul 5: Se selectează „Mean”. „Mode”. Se apasă „OK” din ecranul anterior. Există 10 cazuri cu date valide pe care se bazează analiza.8 ani. Media de vârstă. media aritmetică =22.2. Se deselectează butonul „Display frequencys tables” şi se ignoră mesajul de avertizare. III. „Median”. Nu sunt date lipsă (0). Mediana de vârstă (vârsta persoanei 26 .Introducere în SPSS 2011 Mihaela Naidin Se selectează „vârsta” şi butonul ► pentru a introduce în lista de variabile. Se dă clic pe „Continue”. care reapare. Interpretarea output-ului.

În căsuţele de dialog de la pasul 5 se pot observa mai multe valori statistice adiţionale care pot fi calculate: 1. Abaterea standard (estimată) – este o evaluare a măsurii în care scorurile diferă în medie faţă de media scorurilor pentru o variabilă particulară. Valoarea este pozitivă dacă valorile sunt asimetrice spre stânga. Valoarea mod de vârstă este 17. Variaţia (estimată) – este o evaluare a măsurii în care scorurile variază în medie faţă de media scorurilor pentru variabila respectivă.5 ani. Va fi cu semnul „+” pentru curbe de frecvenţe ascuţite şi cu semnul „-” pentru curbe de frecvenţe „turtite”. 5. Rang – diferenţa dintre cel mai mare şi cel mai mic scor obţinut pentru o variabilă. Suma – indică totalul scorurilor pentru o variabilă. 3. sau negativă dacă valorile sunt asimetrice spre dreapta. 4. 27 . 6.Introducere în SPSS 2011 Mihaela Naidin aflate la mijlocul liniei de vârste de la cea mai mică la cea mai mare) este de 21. Skewness – Este un indicator de asimetrie sau înclinare a distribuţiei scorurilor pentru o variabilă. 2. Exemplu: Al 90-lea centil este valoarea numerică care separă cele 90% de valori de dedesubt. Kurtosis – este un index care arată cât de ascuţită sau turtită este distribuţia scorurilor pentru o variabilă. 8. comparativ cu distribuţia normală. centilele – indică punctele de separaţie pentru procentajele scorurilor. 10. 9. Alte caracteristici. Cvartilele – sunt valorile distribuţiei care indică punctele de separare pentru cele ai mici 20%. III. 7. Maxim (scor) – valoarea celui mai mare scor al datelor pentru o variabilă particulară. din punct de vedere al mărimii.3. Minim (scor) – valoarea celui mai mic scor al datelor pentru o variabilă particulară. cele mai mici 50% şi cele mai mici 75% dintre scoruri.

S. Kurtosis. diferenţa numerică între cel mai mare şi cel mai mic scor obţinut pentru o variabilă. c. Cum putem calcula mediana? a.4. Variance. media reprezintă: a. b. media aritmetică a unui set de scoruri. c. Range. statistics / Compare Means / Means. d. c. d. mean. media aritmetică a unui set de scoruri. valoarea din centrul distribuţiei.E. valoarea cu cea mai mare frecvenţă. c. 2. 4. Pentru a calcula eroarea medie de selecţie alegem: a. Într-un calcul statistic. diferă faţă de media populaţiei. Într-un calcul statistic. abaterea standard este: a. Pentru a calcula asimetria alegem una din opţiunile: a. c. 3. b. III. valoarea cu frecvenţa cea mai mare 28 . b. Range. alegând din meniul Transform / Compute. statistics / summarize / case summaries / statistics.Introducere în SPSS 2011 Mihaela Naidin 11. 5. Std Deviation. care se obţine prin însumarea valorilor şi împărţirea rezultatului la numărul de valori. Skewness. Std Deviation. Mean. Alegeţi răspunsul corect 1. valoarea a măsurii în care scorurile diferă în medie faţă de media scorurilor pentru o variabilă particulară. e. d. Eroarea standard (ES medie) – valoarea medie cu care mediile eşantioanelor extrase dintr-o populaţie. care se obţine prin diferenţa valorilor şi împărţirea rezultatului la numărul de valori. b. b.

mean. Kurtoses. c.Variance. valoarea medie cu care mediile eşantioanelor extrase dintr-o populaţie. III. cât de ascuţită sau turtită este distribuţia scorurilor pentru o variabilă. 8. Kurtosis. comparativ cu distribuţia normală. 8. a. media aritmetică a unui set de scoruri. 7. Range. valoarea a măsurii în care scorurile diferă în medie faţă de media scorurilor pentru o variabilă particulară. c. diferenţa numerică între cel mai mare şi cel mai mic scor obţinut pentru o variabilă. distribuţia scorurilor pentru 2 variabile comparative. c. care se obţine prin însumarea valorilor şi împărţirea rezultatului la numărul de valori. Pentru a calcula boltirea alegem: a. simetria sau asimetria unei distribuţii de frecvenţe faţă de medie. c. comparativ cu distribuţia normală. diferă faţă de media populaţiei. c. b. a. 2. d. diferenţa scorurilor a 2 variabile. Eroarea standard este: a. 4. b. 29 . indică: a.Introducere în SPSS 2011 Mihaela Naidin 6. diferă faţă de media populaţiei. valoarea medie cu care mediile eşantioanelor extrase dintr-o populaţie. Skewness. 6. statistics / Compare Means / Means. d. c. Răspunsuri corecte 1. ca indicator al formei distribuţiei.5. cât de ascuţită sau turtită este distribuţia scorurilor pentru o variabilă. b. 7. S.E. 5. 3. b. Kurtoses. Skewness. c.

Introducere în SPSS 2011 Mihaela Naidin 30 .

Gauss (17771855) şi de aceea distribuţia normală se mai numeşte şi distribuţie gaussiană. De asemenea. Toţi aceşti termeni se referă la acelaşi lucru.Introducere în SPSS 2011 Mihaela Naidin Curs 3 IV. Fr. 31 . mediana şi modulul). trebuiesc îndeplinite simultan următoarele condiţii: • Să fie unimodală – adică să existe un singur modul. adică media = mediana = modulul. a fost descrisă prima dată de Ch. limitele din stânga şi din dreapta ale unei distribuţii normale tind spre valoarea zero. ne punem problema între ce limite putem considera o distribuţie ca fiind normală. • Să fie normal boltită – adică să nu fie nici ascuţită şi nici „turtită”. o singură categorie cu frecvenţă maximă. acest lucru se întâlneşte extrem de rar şi. pe care însă nu o întâlnesc niciodată. Forme ale distribuţiei scorurilor _________________________________________________________________________________________________________________ Este foarte important de studiat forma distribuţiilor scorurilor pentru o variabilă. În practică. Este bine ca o distribuţie să fie simetrică şi cu o formă normală (formă de clopot). distribuţia normală. de aceea. • Să fie simetrică faţă de medie – adică să nu fie deplasată spre stânga sau spre dreapta. Distribuţia normală. Pentru ca o distribuţie să fie considerată normală. în literatura de specialitate se va întâlni şi termenul de distribuţie GaussLaplace. Laplace (17491827). Deoarece la demonstrarea acestui concept a participat şi P.S. O distribuţie perfect normală are aceeaşi valoare pentru toţi cei trei indicatori ai tendinţei centrale (media.

32 .Introducere în SPSS 2011 Mihaela Naidin În exemplul următor este elaborat un tabel de frecvenţă şi o histogramă cu scorurile obţinute la evaluarea coeficientului de inteligenţă pentru 20 de jurişti.

Se apasă „OK”. Introducerea datelor. 33 . Pasul 1: În „Variable View” din „Data Editor” se denumeşte prima coloană „Atenţie”.1. Se înlătură cele două zecimale. Pasul 2: În „Data View” din „Data Editor” se introduc scorurile obţinute la „Atenţie” în prima coloană.Introducere în SPSS 2011 Mihaela Naidin IV. „Descriptives Statistics” şi Frequencies…” Pasul 4: Se selectează „atenţie” şi apoi se apasă butonul ►pentru a introduce în lista de variabile. Pasul 3: Se selectează „Analyze”. *Datele se salvează ca fişier deoarece vor fi folosite şi la capitolul 9.

A patra coloană exprimă aceste frecvenţe ca un procent al numărului total excluzând datele lipsă. Exemplu: Din totalul cazurilor. Exemplu: este 1 caz în care scorul obţinut are valoarea 55. „Histogram” Pasul 2: Se selectează „Atenţie”şi apoi se apasă butonul ► pentru a o introduce în 34 . reprezentările grafice care ne permit să vizualizăm distribuţia de frecvenţe sunt histograma şi poligonul frecvenţelor. Histograma este un grafic. 5% au obţinut scorul 55.3. Distribuţia de frecvenţă se referă la numărul de evenimente statistice pe clase (grupe) de evenimente. Pasul 1: Se seletează: „Graphs”. A treia coloană exprimă aceste frecvenţe ca un procent al numărului total incluzând şi datele care lipsesc. A cincea coloană cumulează aceste procentaje în josul tabelului.2. Interpretarea Output-ului Prima coloană arată scorurile obţinute la testul de „atenţie”. Pentru o serie de date statistice cu o distribuţie de frecvenţă după o variabilă numerică continuă (sau continuă pe porţiuni). Histograme. A doua coloană arată frecvenţa acestor valori. IV.Introducere în SPSS 2011 Mihaela Naidin IV. folosit în statistica descriptivă şi arată o distribuţie de frecvenţă.

Introducere în SPSS 2011 Mihaela Naidin butonul ► butonul ► pentru a o introduce în caseta de în caseta de apasă „OK”. Variabile. Se apasă „OK” variabile Se 35 .

IV. Figura nr. polimodale. Prezenţa a două sau mai multe valori mod determină în distribuţii general bimodale. este o distribuţie bimodală deoarece observăm existenţa a două categorii cu frecvenţa egală şi maximă. trimodale.36.4. Modalitatea. 1. *Abaterea standard este 4. *Numărul cazurilor este 20. Interpretarea output-ului Axa verticală arată frecvenţa cazurilor de la 0 la 14 din doi în doi. adică există Frecvenţa de apariţie doar o singură categorie cu frecvenţa maximă. Înălţimea barelor arată cât de frecvent apare fiecare scor la atenţie.2. distribuţii ce nu pot fi considerate ca fiind distribuţii normale.5. Axa orizontală arată scorurile diferite ale „Atenţiei”. *Media scorului la atenţie este 62. O di din stribuţie (figura similară 2). O distribuţie normală (figura 1) este o distribuţie unimodală. distribuţiei figura 1. Înălţimea subiecţilor.Introducere în SPSS 2011 Mihaela Naidin IV. 36 .

distribuţia este polimodală (multimodală) şi nu poate fi considerată ca fiind normală. O distribuţie este simetrică. aşa cum tratează şi consideră unii. se verifică prin calcularea valorii modul. avem de a Figura nr. vorbim despre o distribuţie asimetrică la stânga (skewness negativ). sunt aglomerate în partea stângă a distribuţiei. 37 . Atunci când rezultatele tind către valori mici. în timp ce distribuţia „C” este o distribuţie asimetrică la stânga (skewness negativ) în care predomină scorurile mari. asimetria este dată de panta distribuţiei şi nu de vârful acesteia. egală. Simetria. IV. Când rezultatele tind către valori mari. În figura nr. se aglomerează în partea dreaptă a distribuţiei. Dacă există o singură valoare cu frecvenţa maximă. 2. 3 face cu o distribuţie asimetrică spre dreapta (sau distribuţie skewness pozitiv). 3. evident. În condiţiile în care sunt două sau mai multe valori cu frecvenţa maximă şi. atunci distribuţia poate fi considerată normală sub acest aspect. dacă valorile sunt egal (simetric) răspândite în jurul tendinţei centrale. sub aspectul modalităţi. Distribuţia „A” este o distribuţie asimetrică la dreapta (skewness pozitiv) unde predomină scorurile scăzute (mici).Introducere în SPSS Figura nr. Iată că.6. 2011 Mihaela Naidin Normalitatea distribuţiei. distribuţia „B” este o distribuţie simetrică.

mediana fiind valoarea care împarte şirul Figura nr. Atunci când discutăm de asimetrie. În acest caz. atunci scorurile mari sunt considerate ca scoruri extreme. În acest scop. 5 ordonat de date în două părţi egale. 4 mai mici decât media este perfect simetrică cu grupa subiecţilor cu scoruri mai mari decât media. atât media. există mai mulţi coeficienţi care pot fi calculaţi. cât şi mediana şi modulul. Într-o distribuţie simetrică. modulul este valoarea situată cel mai la stânga în şirul de date. Caracteristica acestei distribuţii o reprezintă coincidenţa absolută a celor trei indicatori ai tendinţei centrale. vezi figura alăturată). ci o distribuţie care poate fi acceptată ca fiind normală. trebuie să precizăm o serie de relaţii care apar între indicatorii tendinţei centrale. iar dacă în distribuţie predomină scorurile mici. Acest aspect este menţionat din raţiuni teoretice. acest lucru necesită demonstrarea statistică a simetriei sau asimetriei distribuţiei. Evident. se află în acelaşi scoruri punct. predomină scorurile mici. În practică nu vom întâlni o distribuţie perfect normală. Într-o distribuţie asimetrică la dreapta (distribuţie skewness pozitiv. După cum puteţi observa în figura de mai sus. Ştim de la analiza preciziei indicatorilor 38 . media. Grupa subiecţilor cu Figura nr. la mijlocul distribuţiei. iar mediana este mai mică decât media. mediana şi modul. mediana şi modul au exact aceleaşi valori.Introducere în SPSS 2011 Mihaela Naidin Nu ne putem limita la o apreciere pur vizuală a simetriei. media.

poate fi turtită. Într-o distribuţie asimetrică la stânga (distribuţie skewness negativ. Există şi un fel de „asimetrie verticală” sau boltire. media tinde să le pună în valoare. presupune. distribuţia turtită. Această relaţie este relaţia caracteristică a unei distribuţii asimetrice pozitiv. de la analiza preciziei indicatorilor tendinţei centrale. În acest caz. iar dacă în distribuţie predomină scorurile mari. media tinde să le pună în valoare. o deplasare a tendinţei centrale spre stânga sau spre dreapta. Cocoaşa poate fi ascuţită şi atunci vorbim de o distribuţie ascuţită sau leptocurtică. kurtos = „cocoşat”). Asimetria pe orizontală. vezi figura alăturată). că într-o serie de date în care întâlnim scoruri extreme mari. Ştim. Evident. către scoruri mici sau către scoruri mari. Această relaţie este relaţia caracteristică a unei distribuţii asimetrice negativ.Introducere în SPSS 2011 Mihaela Naidin tendinţei centrale. Observaţi relaţia existentă într-o asemenea distribuţie: Mo<Me<m. plată sau platicurtică sau 39 .7. Boltirea (excesul). Observaţi relaţia existentă într-o asemenea distribuţie: Mo>Me>m. iar mediana este mai mare decât media. mediana fiind valoarea care împarte şirul Figura nr. Dar. 6 ordonat de date în două părţi egale. Iată că acest fapt este ilustrat grafic în figura de mai sus. predomină scorurile mari. Iată că acest fapt este ilustrat grafic în figura de mai sus. aceasta nu este singura asimetrie posibilă. atunci scorurile mici sunt considerate ca scoruri extreme. Practic. Termenul folosit generic pentru acest concept este termenul de kurtosis (din limba greacă. după cum am văzut. modulul este valoarea situată cel mai la dreapta în şirul de date. IV. boltirea se referă la aspectul „cocoaşei” distribuţiei rezultatelor. că într-o serie de date în care întâlnim scoruri extreme mici.

) La fel ca şi simetria. la fel ca şi simetria. unde se concentrează acestea? În eşantionul sunt mai degrabă subiecţi scunzi sau subiecţi înalţi? Ori poate există un echilibru între subiecţii scunzi şi cei înalţi). deplasarea valorilor pe axa orizontală (OX). arată că datele sunt foarte grupate şi apropiate de medie. iar distribuţia „A” este o distribuţie normală sub aspectul boltirii. Dacă la simetrie se vorbeşte de frecvenţe (care sunt cele mai frecvente scoruri obţinute. distribuţia „C” este o distribuţie leptocurtică. foarte împrăştiate. O distribuţie leptocurtică. turtită. de modul în care aceste valori se grupează în jurul tendinţei centrale (sunt mai grupate valorile în jurul mediei sau. boltirea nu poate fi apreciată pur „ochiometric” ci avem nevoie şi aici de anumiţi coeficienţi de boltire. Pearson a discutat despre boltire în termeni de momente. ascuţită. Această distribuţie nu ridică nici un fel de probleme atunci când trebuie să diferenţiem subiecţii care obţin scoruri mici sau mari. Figura nr. rezultând astfel coeficientul de boltire sau coeficientul kurtosis. Distribuţia „B” este o distribuţie platicurtică. din contra. distribuţie mezocurtică.Introducere în SPSS 2011 Mihaela Naidin normală. ascuţită. spre deosebire de simetria propriu zisă. sau mezocurtică. 7 Se observă că boltirea nu este altceva decât simetria pe axa verticală (OY). lotul de subiecţi având un mare grad de omogenitate a scorurilor. Avem însă dificultăţi atunci când trebuie să diferenţiem subiecţii din zona medie a distribuţiei. 40 . la boltire se discută de valori. În figura alăturată. O distribuţie normală este întotdeauna o distribuţie mezocurtică.

sunt situaţii în care un asemenea nivel de precizie este ridicol. O distribuţie platicurtică.9. vom putea alege tehnicile şi procedeele statistice pe care le putem folosi. este o distribuţie în care rezultatele sunt foarte împrăştiate faţă de medie şi indică un grad ridicat de eterogenitate a scorurilor. atunci cine va lua. Nu avem nici o problemă cu repartizarea celorlalţi trei elevi. de obicei. această etapă o întâlnim. extrem de dificilă. ar putea fi creşterea preciziei. O distribuţie normală este o distribuţie mezocurtică. plată. imediat după descrierea eşantionului. ci cu 2. Problema generală a acestei distribuţii. doar două zecimi diferenţiază între aproape întreg efectivul de elevi. O evaluare în care distribuţia rezultatelor este leptocurtică. în funcţie de media obţinută – sub 7.9 şi 8. este aceea că diferenţiază greu la extreme şi destul de bine în zona mediei. deşi putem diferenţia relativ uşor elevii medii.9 sau peste 8. cine va lua premiul II şi cine va lua premiul III. Pe aceia îi vom considera ori foarte buni. 27 obţin medii anuale între 7. să facem diferenţieri între elevii slabi şi între elevii buni. dacă nu chiar imposibilă. Totuşi. Iată că. dintre cei 27 de elevi. este o evaluare ce nu poate diferenţia între subiecţii de nivel mediu. în opoziţie cu distribuţia leptokurtică. Singura variantă în acest caz. iar o curbă leptokurtică nu este o distribuţie normală.1. Nu calculăm media cu o singură zecimală. ori foarte slabi. după cum se poate vedea. în imposibilitatea de ai-i ierarhiza în vreun fel. utilizând o asemenea distribuţie. 3 sau 4 zecimale. iată. Datorită acestui fapt. Ce ne facem însă cu cei 27 de subiecţi? Suntem. premiul I.Introducere în SPSS 2011 Mihaela Naidin De exemplu. 41 . Dacă presupunem că cei trei subiecţi au note mai mici de 7. Deoarece. Analiza unei distribuţii sub aspectul normalităţii este primul pas pe care îl facem în orice prelucrare de date. Decizia ar fi.1. la începutul oricărui raport de cercetare. în funcţie de rezultatul acestei analize. o distribuţie platicurtică nu este nici ea o distribuţie normală. dacă într-o clasă de 30 de elevi. Va fi greu.

b. analyze/ descriptive statistics/frequences/descriptives. media < mdiana< modul. trimodală. exprimă aceste frecvenţe ca un procent al numărului total excluzând datele lipsă. Pentru a obţine un tabel de frecvenţe accesăm: a. O distribuţie poate fi: unimodală. graphs/interactve. frecvenţa valorilor. 2. c. arată o distribuţie de frecvenţă. b. c. c. a. Pentru a crea o histogramă accesăm: a. b. Într-o distribuţie asimetrică la dreapta: 42 . graphs/histogram. 6. media >mediana>modul. 5. frecvenţe ca un procent al numărului total lipsesc incluzând şi datele care lipsesc. Într-o distribuţie simetică: a. Alegeţi răspunsul corect 1. analyze/ descriptive statistics/frequences. c. Valid procent: a. bimodală. analyze/ descriptive statistics/descriptives. c. 7. 3. c. b. a. 4.8.Introducere în SPSS 2011 Mihaela Naidin IV. b. Histograma: este un grafic folosit în statistica descriptivă. se foloseşte pentru date calitative. graphs/control. media = mediana = modul. b.

datele sunt foarte împrăştiate de mediană iar lotul de subiecţi are un grad mare de eterogenitate. e. leptocurtică. d. modul=mediana=modul. c. b.Introducere în SPSS 2011 Mihaela Naidin a. b. datele sunt foarte grupate şi apropiate de mediană iar lotul de subiecţi are un grad mare de omogenitate. modul>mediana>modul. distribuţia este normală. platicurtică. datele sunt foarte împrăştiate de mediană iar lotul de subiecţi are un grad mare de eterogenitate. 9. O distribuţie platicurtică arată că: d. modul <mediana>modul. distribuţia este normală. modul <mediana<media. f. O distribuţie leptocurtică arată că: a. modul>mediana>modul. 43 . asimetrică pozitiv. b. asimetrică negativ. datele sunt foarte grupate şi apropiate de mediană iar lotul de subiecţi are un grad mare de omogenitate. mezocurtică. f. b. 8. c. 11. e. modul=mediana=media. c. 10. toate variantele de mai sus. O distribuţie poate fi: a. Într-o distribuţie asimetrică la dreapta: a. c.

11. a. f. Răspunsuri corecte 1. analyze/ descriptive statistics/frequences. analyze/ descriptive statistics/frequences. toate variantele de mai sus. b. 10. graphs/histogram. 9. b. datele sunt foarte grupate şi apropiate de mediană iar lotul de subiecţi are un grad mare de omogenitate. 4. 7. arată o distribuţie de frecvenţă. 2. unimodală. 6. b. 5. datele sunt foarte împrăştiate de mediană iar lotul de subiecţi are un grad mare de eterogenitate. a. modul>mediana>modul.Introducere în SPSS 2011 Mihaela Naidin IV. bimodală. trimodală. b. c. 44 . c.9. a. a. a. este un grafic folosit în statistica descriptivă. media = mediana = modul. 8. a. 3. modul <mediana<media. b.

Introducere în SPSS 2011 Mihaela Naidin Curs 4 V. Abaterea standard. Pasul 1: În „Variable View” din „Data Editor” se denumeşte prima coloană „Vârsta”. Se înlătură cele două zecimale. Calcularea abaterii standard şi a scorurilor Z este prezentată în exemplul următor: Vârstă 20 22 25 26 35 38 28 24 23 24 V. Abaterea standard poate fi folosită şi pentru a transforma scoruri pentru variabile foarte diferite în scoruri Z (sau standard).1. care sunt uşor de comparat şi însumat. Pasul 2: În „Data View” din „Data Editor” se introduc vârstele în prima 45 . ________________________________________________________________________________________________________________ Abaterea standard este un indice care arată cât de mult deviază (diferă) unele scoruri „în medie” faţă de media setului de scoruri din care acestea fac parte. Introducerea datelor.

V. Se selectează „Continue”. 2. Scorurile Z Pasul 1: 46 . Se selectează „Options…” Pasul 5: Se deselectează „Mean”. „Maximum”. Interpretarea output-ului. V.115. Se selectează „OK” din ecranul precedent care reapare. Pasul 3: Se selectează: „Analyze” „Descriptive Statistics” „Descriptives…” Pasul 4: Se selectează „vârsta” şi apoi se apasă butonul ► pentru a o introduce în lista de variabile.3. „Minimum”.Introducere în SPSS 2011 Mihaela Naidin coloană. Abaterea standard pentru vârstă este de 6. Numărul 10 reprezintă numărul de cazuri.

rangul. V. notele „z” sunt note obţinute pe o „curbă” cu media 0 şi abaterea standard 1.11 ani (N= 10)”. în termeni de abatere standard. Abaterea standard pentru o variabilă este uşor de menţionat în textul raportului: „A fost determinată abaterea standard a vârstei ca fiind 6. În acest caz. cum ar fi media. Raportarea output-ului. dintre care menţionăm (Popa.Introducere în SPSS 2011 Mihaela Naidin La pasul 4 selectaţi „Save standardized values as variables”. *Este posibil ca abaterea standard să fie înregistrată împreună cu alte statistici. după cum observaţi în figura de mai jos. 2006): • Media unei distribuţii „z” este egală cu zero. Notele „z” au şi ele o serie de proprietăţi cu aplicabilitate practică deosebită. Notele „z” reprezintă diferenţa dintre scorul observat şi medie. afirmaţie ce rezultă din proprietatea acestui indicator de a se diminua atunci când scădem o 47 . Cu alte cuvinte. între aceste note regăsindu-se peste 99% din populaţie. Teoretic.4. Pasul 2: Scorurile Z sau standard sunt în a doua coloană din „Data View” în „Data Editor” şi sunt numite „ZVârstă”. o distribuţie normală are practic notele „z” cuprinse între -3 şi +3. notele „z” nu sunt altceva decât distanţele la care se situează scorurile particulare în raport cu media grupului iar această distanţă este exprimată standardizat. etc. Se apasă „OK”.

 Range (amplitudinea). Trebuie să ştim bine ce înseamnă distribuţia normală pentru a înţelege corect semnificaţia acestor note.  Maximum. Şi această afirmaţie rezultă din proprietăţile abaterii standard. observăm că acea constantă cu la care împărţim este chiar abaterea standard iar împărţirea a două numere egale are ca rezultat 1 Notele „z” sunt note direct calculabile.6. utilizându-se media şi abaterea standard şi reprezintă „temelia” oricărui proces de standardizare. Din formulă. * Aceste concepte sunt explicate pe scurt la sfârşitul capitolului 3.Introducere în SPSS 2011 Mihaela Naidin constantă din fiecare scor particular. iarăşi. valoarea acesteia se divide corespunzător. Alte caracteristici. Ştim că dacă împărţim abaterea standard cu o constantă.  Kurtosis.  Standard deviation (estimate) (abaterea standard). Deoarece din formulă rezultă această diferenţă (se scade fiecare scor particular din medie). greu de utilizat. ceea ce le face. În meniul „Descriptives Statistics sunt conţinute mai multe calcule statistice care pot fi selectate:  Mean (media).5. În plus.  Skewness. Totuşi. V. principalul dezavantaj al notelor „z” este acela că sunt puţin intuitive. V. în final media va ajunge la valoarea zero • Abaterea standard a unei distribuţii „z” este întotdeauna 1. Alegeţi răspunsul corect 48 .  Minimim.  Sum (suma). au valori pozitive şi negative.

b. 2. Media aritmetică reprezintă: a) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar fi eterogenă b) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar fi omogenă c) valoarea pe care ar purta-o fiecare variabilă statistică dacă distribuţia ar fi omogenă.Introducere în SPSS 2011 Mihaela Naidin 1. 49 . c) se calculează adunând valorile existente. c. 4. este un indice care arată cât de simetrică sau asimetrică este o distribuţie. ca indicator fundamental al tendinţei centrale: a) reprezintă valoarea care modifică nivelul totalizator. b)se foloseşte cel mai frecvent şi reprezintă suma valorilor raportată la numărul lor. Abaterea standard: a. este un indice care arată cât de turtită sau boltită este o distribuţie. d) nu poate determina numărul de unităţi din colectivitate. 3. Media aritmetică. adică. înlocuind fiecare nivel individual al caracteristicii de distribuţie cu nivelul mediu: a) suma seriei rămâne aceeaşi b) suma termenilor seriei se modifică c) suma termenilor seriei este nulă. Media este o mărime generalizată . este un indice care arată cât de mult deviază (diferă) unele scoruri „în medie” faţă de media setului de scoruri din care acestea fac parte.

Răspunsuri corecte 1.Introducere în SPSS 2011 Mihaela Naidin V. a) suma seriei rămâne aceeaşi 3. se foloseşte cel mai frecvent şi reprezintă suma valorilor raportată la numărul lor. b) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar fi omogenă 4. 50 .7. este un indice care arată cât de mult deviază (diferă) unele scoruri „în medie” faţă de media setului de scoruri din care acestea fac parte. 2. a. b.

Introducere în SPSS

2011

Mihaela Naidin

Curs4

VI. Relaţiile dintre două sau mai multe variabile.
________________________________________________________________________________________________________________

Diagrame şi tabele.

În foarte multe cercetări se studiază relaţiile dintre două sau mai multe variabile. Procedurile statistice univariate (cu o singura variabilă) care au fost descrise până acum pot fi utilizate pentru analiza oricăror date. Dar, cercetarea poate necesita ca relaţiile şi corelaţiile dintre diferitele variabile să fie studiate. La fel ca statistica univariată, statistica bivariată a datelor necesită studierea tendinţelor fundamentale ale datelor utilizând tabele şi diagrame. Modelele de prezentare a relaţiilor bivariate includ crearea tabelelor scatter. O condiţie esenţială o constituie etichetarea tabelelor şi diagramelor şi denumirea acestora. În continuare se va ilustra elaborarea unui tabel de asociere şi a unei diagrame cu bare.

VI.1. Introducerea datelor.
În studiu sunt introduşi 11 copii instituţionalizaţi şi 9 copii neinstituţionalizaţi. Dintre aceştia 9 au fost fete şi 11 au fost băieţi. Pasul 1: În „Variable View” din „Data Editor” se denumeşte: - prima coloană „Instituţionalizare” - a doua coloană „Genul biologic”; - A treia coloană „Frecvenţa”.

Se înlătură cele două zecimale.

51

Introducere în SPSS

2011

Mihaela Naidin

Pasul 2: Se etichetează cele două valori ale instituţionalizării: 1 - instituţionalizat; 2 - neinstituţionalizat. Şi genul biologic: 1. Feminin; 2. Masculin
*Paşii acestei proceduri au fost explicaţi în capitolul 1.

Pasul 3: Se introduc aceste numere în „Data View” din „Data Editor”. Primul rând se referă la fetele care au fost instituţionalizate: sunt în număr de 5. Al doilea rând se referă la băieţii care au fost instituţionalizaţi: sunt în număr de 6. Al treilea rând se referă la fetele neinstituţionalizate: sunt în număr de 4. Al patrulea rând se referă la băieţii neinstituţionalizaţi: sunt în număr de 5.

VI.2. Ponderea datelor
Pasul 4: Pentru a pondera datele cu scopul ca cele patru celule să conţină numărul de cazuri corespunzător, se selectează: „Data” „Weight Cases…” Pasul 5: Se selectează „Frecvenţa”, „Weight cases by” şi apoi se apasă butonul ►pentru transfer în căsuţa variabilei„Frequency Variable”.
52

Introducere în SPSS

2011

Mihaela Naidin

Se apasă „OK”

VI.3. Crearea tabelelor de asociere (Crosstabs).
Pasul 6: Se selectează: „Analize” „Descriptivesc statistics” „Crosstabs…”. Pasul 7: Pentru a pune „instituţionalizare” pe rândurile tabelului, se selectează şi apoi se apasă butonul ►de lângă eticheta „Row(s)”. Pentru a pune „genul biologic” pe coloanele tabelului, se selectează şi apoi se apasă butonul ► de lângă eticheta „Column(s). Se apasă „OK”. Pasul 8: În tabel sunt prezentate valorile celor două variabile. Se observă că sunt 5 fete şi 6 băieţi instituţionalizaţi (în total 11) şi 4 fete şi 5 băieţi neinstituţionalizaţi (în total 9). (N=20).
Tabelul de asociere este folosit pentru prezentarea relaţiilor dintre două variabile categoriale. În fiecare celulă a tabelului este prezentată frecvenţa parţială (adică efectivul care poartă simultan o valoare a fiecărei variabile). Observaţie: 1. Dacă într-un crosstabs numărul categoriilor unei variabile este mai mare decât al alteia, atunci categoriile acelei variabile se plasează pe rânduri. 2. O celulă din crosstabs oferă informaţia despre intersecţia celor două variabile. Pentru aceasta alegem din fereastra Crosstabs butonul de comandă Cell ce are ca efect afişarea ferestrei Crosstabs Cell Display. 53

descrescător.00 indică faptul că 54 . crescător. Există mai multe tipuri de corelaţii atât parametrice cât şi neparametrice. o diagramă scatter a celor două variabile va arăta că toate punctele sunt conţinute de o singură dreaptă. Absenţa oricărei legături (corelaţii) dintre variabile se traduce prin r =0. sau invers. Cu alte cuvinte. Corelaţia Pearson(r) evaluează gradul de asociere dintre două variabile măsurate pe scală de interval/raport. unde valorile extreme presupun o relaţie perfectă între variabile în timp ce 0 înseamnă o lipsa totala de relaţie liniară. scorurile pentru cealaltă variabilă descresc) şi r = +1 (corelaţie perfectă pozitivă: ceea ce înseamnă că scorurile unei variabile se măresc odată cu creşterea scorurilor celeilalte variabile).Introducere în SPSS 2011 Mihaela Naidin Curs 5 VII. Cel mai comun şi cel mai folositor este coeficientul de corelaţie Pearson şi coeficientul de corelaţie Spearman. O corelaţie de 1. Dacă valorile unei variabile urmează. Coeficienţi de corelaţie. Corelaţia este o metodă statistică utilizată pentru a determina relaţiile dintre două sau mai multe variabile. atunci cele două variabile corelează între ele.00 indică o asociere perfectă între cele două variabile. O valoare de 0. El variază între (-1 si +1). O interpretare mai adecvată a valorilor obţinute se face prin compararea rezultatului obţinut cu anumite valori prestabilite în tabele de corelaţii în funcţie de numărul de subiecţi. Domeniul de variaţie a coeficientului de corelaţie Pearson(r) este între r = -1 (corelaţie perfectă negativă: ceea ce înseamnă că în timp ce scorurile unei variabile cresc. după un model de tip liniar. Coeficientul de corelaţie este o valoare cantitativă ce descrie relaţia dintre două sau mai multe variabile. în sens direct. valorile celeilalte variabile. tipul de legătură şi pragul de semnificaţie dorit. _________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________ Coeficienţi de corelaţie Pearson şi Spearman. Aceasta se referă la intensitatea şi sensul de variaţie concomitentă a valorilor unei variabile în raport cu cealaltă.

folosind pentru aceasta datele din tabelul următor.1. Introducerea datelor. o diagramă scatter şi coeficientul de corelaţie Spearman.2.matematică în a doua coloană.Introducere în SPSS 2011 Mihaela Naidin toate punctele din diagrama scatter sunt dispersate aleatoriu în jurul oricărei drepte desenate pe această diagramă a datelor sau sunt aranjate într-o manieră curbilinie. * Se înlătură cele două zecimale. „Corelate”.muzică în prima coloană. Pasul 2: În „Data View” din „Data editor” se introduc datele pentru: . muzica 3 matematică 7 7 5 8 4 9 4 9 5 6 8 4 9 3 9 4 7 7 6 VII. Pasul 1: În „Variable „View” din „Data Editor” se denumeşte primul rând „muzică” şi al doilea rând „matematică”. Pasul 1: Se selectează: „Analyze”. . Corelaţia Pearson. care reprezintă scoruri ale abilităţilor muzicale şi matematice pentru 10 copii. „Bivariate…” Pasul 2: 55 . În continuare vom ilustra calculul corelaţiei Pearson. VII.

corelaţia este statistic semnificativă. VII. Interpretarea output-ului.90.845 La un test de semnificaţie.4. Corelatia nu trebuie identificata cu cauzalitatea. Înseamnă că nivelul de semnificaţie este mai mic decât 0.  Interpretarea psihologică va fi: „Există o relaţie negativă semnificativă între abilităţile muzicale şi cele matematice . VII. 56 . in sensul ca observatiile a 2 variabile se pot corela foarte bine fara sa avem motive logice si stiintifice ca una dintre variabile poate fi cauza celeilalte. * Se obişnuieşte să se rotunjească corelaţia cu două zecimale. acesta fiind un rezultat mult mai precis pentru majoritatea măsurătorilor psihologice. este 0. Two-tailed – dacă distribuţia este bidirecţională. Informaţia apare şi în această celulă. deci aceasta va deveni 0. dar ea poate fi nesemnificativa din cauza volumului mic a esantionului studiat. cu trei zecimale. Corelaţia dintre „matematică” şi „muzică” este . Un coeficient de corelatie poate fi calculat corect numai când datele ambelor variabile se refera la esantioane si fiecare este ales independent. Coeficientul de corelaţie Spearman.5.  Corelaţia dintre abilităţile muzicale şi cele matematice este – 0. *One tailed – dacă distribuţia este unidirecţională.01 sau mai mic. Un coeficient de corelatie poate fi apropiat de ą1. Numărul cazurilor pe care este bazată corelaţia este 10.01.3. Raportarea output-ului. Se apasă „OK”.0. ceea ce înseamnă că. deci ne va indica o corelatie puternica.845. two-tailed la nivelul de probabilitate 0.  Nivelul de semnificaţie exact. copii cu nivel ridicat al abilităţilor muzicale au un nivel scăzut al abilităţii matematice”.Introducere în SPSS 2011 Mihaela Naidin Se selectează „Muzică” şi „Matematică” şi apoi se apasă butonul ►pentru a le introduce în lista de variabile aşa cum este arătat în figura din dreapta.002. VII.

Introducere în SPSS 2011 Mihaela Naidin Pasul 1: Identic corelaţiei Pearson se selectează „Analyze”. VII. Numărul cazurilor este 10.  Corelaţia raportată cu două zecimale este – 0.7. deci corelaţia este statistic semnificativă.8. Raportarea output-ului. deci avem clasamente identice. inseamna ca suma patratelor diferentelor este aproape nula. „Bivariate” şi variabilele care se doresc pentru corelaţie. Acest coeficient variaza intre -1 si +1. VII.6. ceea ce semnifică faptul că. Coeficientul de corelaţie Spearman între muzică şi matematică este – 0. O valoare apropiata de 0. O valoare apropiata de +1. • • • Coeficientul de corelatie al rangurilor (Spearman) testeaza gradul de corelare intre 2 variabile calitative. VII. este alternativa neparametrica a “coeficientului de corelatie Pearson”. 57 . Diagrama scatter. cei cu un nivel ridicat al abilităţii muzicale au abilităţi matematice scăzute şi viceversa”.84.842. iar valoarea apropiata de -1 pune in evidenta discordanta maxima a variabilelor. „Correlate”. Interpretarea output-ului. inseamna necorelarea variabilelor. Nivelul de semnificaţie este 0. Se apasă „OK”. Se selectează „Spearman” şi se deselectează Pearson (dacă nu se doreşte ca şi corelaţie).  Interpretarea psihologică va fi: „Există o corelaţie negativă semnificativă între abilităţile muzicale şi cele matematice.001 sau mai mic.

Se apasă „OK”. 58 . Pasul 3: Pentru a avea variabila „muzică” ca axă verticală.9. VII. se selectează apoi se apasă butonul ◄ de lângă căsuţa „X Axis”. se selectează şi apoi se apasă butonul ►de lângă căsuţa „Y Axis” Pentru a avea variabila „matematică” ca axă orizontală.Introducere în SPSS 2011 Mihaela Naidin Pasul 1: Se selectează: „Graphs” „Scatter/Dot” Pasul 2: Se selectează „define” din moment ce „simple” este deja selectat. Interpretarea output-ului.

Forma împrăştierii rezultatelor este relativ în linie dreaptă. ceea ce indică o corelaţie negativă. răspândirea punctelor este relativ îngustă.11. Despre diagrama scatter s-ar putea scrie următoarele afirmaţii: „ A fost examinată o diagramă scatter pentru relaţia dintre abilităţile muzicale şi matematice. *Dacă relaţia este curbilinie atunci corelaţiile Pearson şi Spearman pot fi înşelătoare. ceea ce indică o corelaţie mare. indicând mai degrabă o relaţie în linie dreaptă decât o relaţie curbilinie.10. Alegeţi răspunsul corect 59 . VII. Linia este de la colţul stânga sus până în dreapta jos. VII.Introducere în SPSS 2011 Mihaela Naidin În diagrama scatter. Raportarea output-ului. Nu există nicio dovadă privind o relaţie curbilinie sau asupra influenţei avute de rezultatele atipice”.

a. 4. măsoară rangul unei distribuţii trihotomice 2.Introducere în SPSS 2011 Mihaela Naidin 1. ambele variante de mai sus. evaluează gradul de asociere dintre două variabile măsurate pe scală nominală. b. că scorurile unei variabile se măresc odată cu creşterea scorurilor celeilalte variabile). b. c. neparametric.00 indică: a. 5. c. 6. neparametric. 60 . Spearman este un indice de corelaţie: a. Pearson este un indicator de corelaţie: parametric. măsoară variaţia concomitentă a doi factori b. b. parametric. ambele variante de mai sus. O corelaţie de 1. b. faptul că toate punctele din diagrama scatter sunt dispersate aleatoriu în jurul oricărei drepte desenate pe această diagramă a datelor. o asociere perfectă între cele două variabile. c. b. Corelaţia: a. O corelaţie negativă semnifică faptul că: a. scorurile pentru cealaltă variabilă descresc. c. absenţa oricărei legături (corelaţii) dintre variabile. în timp ce scorurile unei variabile cresc. 3. c. măsoară parametria distribuţiei între două eşantioane c. evaluează gradul de asociere dintre două variabile măsurate pe scală ordinală. nu există nicio legătură între variabile. evaluează gradul de asociere dintre două variabile măsurate pe scală de interval/raport. Corelaţia Pearson(r): a.

modificarea unui tabel 61 . Statistics / Custom tables / Crosstabs 10. a reprezenta relaţia dintre variabile. în timp ce scorurile unei variabile cresc. Analyze/Descrisptiv statistics/crosstabs. Statistics / Corelate / Crosstabs d. c. Norul de puncte este folosit pentru: a. că scorurile unei variabile se măresc odată cu creşterea scorurilor celeilalte variabile). a arăta frecvenţa de apariţie pentru diferite clase de valori ale variabilei observate. f. a arăta intzervalul de încredere de 95% pentru media respectivă. recodificarea variabilelor d. b. prezentarea relaţiilor dintre două variante categoriale c. Tabelul de asociere este folosit pentru: a. 2011 Mihaela Naidin O corelaţie pozitivă semnifică faptul că: d. Pentru a realiza un tabel de asociere selectăm: a. 9. c. selectarea unor subiecţi b. nu există nicio legătură între variabile.Introducere în SPSS 7. e. Analyze/Descrisptiv statistics/Explore. scorurile pentru cealaltă variabilă descresc. 8. b.

scorurile pentru cealaltă variabilă descresc. neparametric. a. 6. în timp ce scorurile unei variabile cresc. b. a. Analyze/Descrisptiv statistics/crosstabs. o asociere perfectă între cele două variabile. că scorurile unei variabile se măresc odată cu creşterea scorurilor celeilalte variabile). 3. b.12. 10. prezentarea relaţiilor dintre două variante categoriale 62 . a reprezenta relaţia dintre variabile. 5. evaluează gradul de asociere dintre două variabile măsurate pe scală de interval/raport. e. 9. Răspunsuri corecte 1. măsoară variaţia concomitentă a doi factori 2. neparametric. a. 8.Introducere în SPSS 2011 Mihaela Naidin VII. 7. a. 4. b. a. a.

Pasul 1: În „Variable „View” din „Data Editor” se denumeşte primul rând „muzică” 63 . _________________________________________________________________________________________________________________ Predicţia cu precizie. Daca am avea o corelatie perfecta (+1 sau –1) estimarea ar fi extrem de precisa VIII. Predictia este procesul de estimare a valorii unei variabile cunoscând valoarea unei alte variabile. Introducerea datelor. Cu cât este mai puternică corelaţia cu atât este mai bună predicţia. Se poate investiga şi punctul de tăiere. prin intermediul regresiei se pot face predictii ale unei variabile.Introducere în SPSS 2011 Mihaela Naidin VIII.1. aceasta fiind cunoscută şi ca variabilă predictor sau variabila X. Variabila independentă este variabila folosită pentru a realiza predicţia. Regresia devine o tehnică mult mai importantă atunci când sunt folosite mai multe variabile pentru predicţia valorilor unei alte variabile. în functie de valoarea alteia. Regresia se leaga foarte mult de conceptul de corelatie. acesta fiind punctul în care panta se intersectează cu axa verticală. Axa orizontală X este variabila independentă şi axa verticala Y este variabila dependentă. *Este foarte important a nu se confunda variabila independentă cu cea dependentă. Cel mai bun mod de a evita aceste probleme este de a examina scatterplot-ul sau diagrama scatter a relaţiei dintre cele două variabile. Regresia. O asociere puternica între doua elemente conduce la cresterea preciziei predictiei unei variabile pe seama alteia. În continuare este ilustrată procesarea unei regresii simple şi a unei diagrame de regresie folosind datele din tabelul următor. Dacă există o relaţie între două variabile atunci sunt posibile estimarea sau predicţia scorului unei persoane la o variabilă pornind de la scorul obţinut la cealaltă variabilă. Scor muzica Scor matematică 3 7 7 5 8 4 9 4 9 5 6 8 4 9 3 9 4 7 7 6 Unul din principalele capitole ale statisticii are în vedere posibilitatea de a face predictii. Desi nu se gasesc relatii perfecte în lumea reala.

VIII. Se selectează „Continue”.muzică în prima coloană. pentru a introduce această variabilă în căsuţa variabilei dependente. Se apasă „OK” din ecranul precedent care reapare. Se selectează „matematica” şi apoi se apasă butonul ◄ de lângă eticheta „Independent(s) pentru a introduce această variabilă în căsuţa variabilei (lor) independente. Regresia simplă. . şi al doilea rând „matematică”.2. Pasul 2: În „Data View” din „Data editor” se introduc datele pentru: .Introducere în SPSS 2011 Mihaela Naidin * Se înlătură cele două zecimale. 64 .matematică în a doua coloană. Se selectează „Statistics…” Pasul 3: Se selectează „Confidence Intervals”. Pasul 1: Se selectează: „Analyze” „Regression” „Linear…” Pasul 2: Se selectează „Muzică” şi apoi se apasă butonul ► de lângă eticheta „Dependent”.

B este panta liniei de regresie (în SPSS fiind denumită coeficient de regresie nestandardizat).716.845. Coeficientul nestandardizat Coeficientul standardizat Intervalul de al regresiei este – 1. Scatterplot-ul de regresie. Interpretarea output-ului. Intervalul de încredere de 95% arată intervalul pantelor de regresie în care putem fi siguri într-o proporţie de 95% că panta pentru populaţie se va găsi.845. cele matematice.049.3.  Intervalul de încredere de 95% pentru aceşti coeficienţi este de la -1.59 la -0. Atunci când se realizează o regresie este recomandabilă cercetarea diagramei scatter pentru cele două variabile. Acesta este punctul în care linia de regresie intersectează axa verticală. pentru fiecare creştere cu 1 mai puţin coeficientul de a variabilei “matematică” corelaţie Pearson dintre valoarea variabilei “muzică” abilităţile muzicale şi descreşte cu – 1. Acesta este mai mult sau de la -1. încredere ia valori Acesta semnifică faptul că.4.049.  Cota denumită „Beta” are valoarea -0. Pasul 1: Se selectează: „Graphs” „Scatter/Dot” Pasul 2: 65 . Aceasta este de fapt corelaţia Pearson între cele două variabile.50. Constanta este 12.507. Regresia simplă . al regresiei este – 0.  În acest tabel. Acest tabel conţine datele esenţiale pentru analiza regresiei.591 la -0.Introducere în SPSS 2011 Mihaela Naidin VIII.o variabila dependenta si una independent VIII.

Introducere în SPSS 2011 Mihaela Naidin Se selectează „define”. În regresie. „simple” este deja selectat. În plus. se selectează şi apoi se apasă butonul ►de lângă căsuţa „Y Axis” Pentru a avea variabila „matematică” ca axă orizontală. Pasul 3: Pentru a avea variabila „muzică” ca axă verticală. În consecinţă B are valoare negativă. Linia de regresie are o pantă negativă în acest caz. Interpretarea output-ului. de exemplu: de la stânga sus spre dreapta jos. Se apasă „OK” Pasul 4: Pentru a încadra o linie de regresie în scatterplot. 66 . Se selectează „Elements” şi „Fit Line at Total”. axa verticală este variabila-criteriu sau dependentă (în cazul nostru = muzica). VIII. se dă dublu clic oriunde în interior şi se va deschide „Chart Editor”.5. Punctele de pe scatterplot sunt apropiate de linia de regresie. se selectează apoi se apasă butonul ◄ de lângă căsuţa „X Axis”. punctele par să formeze o linie dreaptă (relaţia nu este curbilinie).

67 .Introducere în SPSS 2011 Mihaela Naidin În regresie axa orizontală este variabila predictor sau independentă (în cazul nostru „matematică”).

indică o relaţie negativă între cele două variabile. Interpretarea diagramei se poate realiza în felul următor: „Diagrama scatterplot a relaţiei dintre abilităţile matematice şi muzicale sugerează o relaţie liniară negativă între cele două variabile.relatia dintre cele doua variabile poate fi descrisa printr-o dreapta în cadrul norului de puncte. de la stânga sus spre dreapta jos. 68 . Punctele par relativ apropiate de line.6. ceea ce sugerează că beta (corelaţia) ar trebui sa fie un număr mare (negativ) şi că intervalul de încredere este relativ mic.Introducere în SPSS 2011 Mihaela Naidin * Linia de regresie oblică. VIIII. Regresia liniară . Este posibilă predicţia cu acurateţe a abilităţii muzicale a unei persoane cunoscând abilitatea sa matematică. Raportarea output-ului.

Introducere în SPSS 2011 Mihaela Naidin IX. Pasul 1: Se introduc datele în „Data Editor”. 2. Eroarea standard estimată a mediei. cu alte cuvinte este media măsurii cu care media eşantioanelor diferă faţă de media populaţiei din care au fost extrase. prezentate în tabelul următor. Introducerea datelor. Pasul 1: Se selectează: „Analyze” „Descriptive Statistics” „Descriptive…” Pasul 2: 69 . Eroarea standard _________________________________________________________________________________________________________________ Eroarea standard este un indice pentru variabilitatea mediilor mai multor eşantioane extrase din populaţie. Calcularea erorii standard estimate pentru medie este ilustrată cu un set de şase scoruri ale stimei de sine. cum ar fi Testul t şi este un concept important pentru calculul intervalelor de încredere. IX. 1. Se etichetează variabila „Stima”. Stima de sine 5 7 3 6 4 5 IX. Eroarea standard poate fi folosită ca un pas intermediar în alte tehnici statistice.

 testul oferă valoarea erorii standard a mediilor eşantioanelor ca fiind 0. Testul t. Eroarea standard (estimată) pentru medie a acestui eşantion este 0. _________________________________________________________________________________________________________________ Compararea a două eşantioane de scopuri corelate/relaţionate. Interpretarea output-ului.  tabelul include şi alte informaţii cum ar fi media (5. X.  ultima coloană oferă abaterea standard (estimată) a celor şase scopuri. abaterea standard estimată a populaţiei bazată pe acest eşantion.577. Se selectează „Options…” Pasul 3: Se selectează „ S-E mean”.58 (suma este rotunjită la două zecimale) aceasta fiind valoarea medie cu care mediile eşantioanelor (N=6) diferă faţă de media populaţiei.41. IX. este o indicaţie a mediei cu care mediile eşantioanelor diferă de media populaţiei din care au fost extrase. valorile minime şi maxime ale datelor.00). Se selectează „continue”. Se apasă „OK” din ecranul anterior care reapare. 3. care este 1. 70 .Introducere în SPSS 2011 Mihaela Naidin Se selectează „stima de sine” şi apoi se apasă butonul ◄pentru a introduce variabila „Stima de sine” în „variable(s)”.

a doua variantă a testului t este utilizată în momentul în care două seturi diferite de valori provin din grupe diferite de participanţi. – testul t pentru eşantioane independente.Introducere în SPSS 2011 Mihaela Naidin Testul t este folosit pentru evaluarea semnificaţiei statistice a diferenţei dintre mediile pentru două seturi de scoruri. Cu ajutorul testului t se pune în evidenţă dacă valoarea medie pentru un set de scoruri diferă în medie de valoarea medie pentru alt set de scoruri. 2. Numărul de cuvinte verbalizate într-un minut la vârste diferite. 18 luni 24 luni Alina 3 5 Cristina Raluca Carmen Simona Radu 2 4 5 2 3 4 7 8 3 4 Cristi 2 4 Dan 4 6 71 . Dacă distribuţia este foarte diferită de forma de clopot ar trebui luată în considerare utilizarea unei tehnici statistice relaţionate nonparametrică pentru eşantioane perechi. cum ar fi testul de perechi Wilcoxon. Procesarea unui Test t este ilustrată cu datele din tabelul următor unde sunt prezentate numărul de cuvinte pe care aceeaşi copii le-au verbalizat cu mamele lor la 18 luni şi la 24 luni. * Testul t pentru eşantioane perechi este optim dacă distribuţia diferenţelor dintre cele două seturi de valori se prezintă (aproximativ) sub formă de clopot (atunci când distribuţia este normală). prima variantă este folosită atunci când cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eşantion sau când coeficientul de corelaţie între cele două seturi este mare – testul t pentru eşantioane perechi. Testul t are două variante: 1.

Se selectează „douăzeci şi patru” şi se pune această variabilă lângă eticheta „Variable2” sub „Curent Selections”. Se apasă „OK”. * Se înlătură cele două zecimale. Pasul 1: În „Variable View” din „Data Editor” se etichetează primul rând cu „optsprezece” şi al doilea rând cu „douăzeci şi patru”.Introducere în SPSS 2011 Mihaela Naidin X.2. 72 . Introducerea datelor. Pasul 2: În „Data View” din „Data Editor” se introduc datele în primele două coloane. X. Testul t pentru eşantioane perechi Pasul 1: Se selectează: „Analyze” „Compare Means” „Paired-Samples T Test…” Pasul 2: Se selectează „optsprezece” şi se pune această variabilă lângă eticheta „Variable1” sub „Curent Selections”. Se apasă butonul ►pentru a pune aceste două variabile în lista variabilelor relaţionale.1.

Media pentru „optsprezece” este 3. 73 .00). Primul tabel arată media.00.000 este de fapt diferenţa dintre mediile pe 18 şi 24 luni. Valoarea lui t este bazată pe această medie a diferenţei (-2.483). Corelaţia dintre ele 0. Primele trei coloane care conţin cifre sunt componentele fundamentale ale calcului unui Test t relaţionat. Calculul oferă valoarea lui t (-7. deci în realitate este media diferenţei. Rezultatele obţinute ar putea fi prezentate astfel: „Media numărului de cuvinte verbalizate la 18 luni diferă semnificativ de media cuvintelor verbalizate la 24 de luni. Aceasta este o corelaţie mare. nivelul de semnificaţie fiind de 0.Introducere în SPSS 2011 Mihaela Naidin X.267).3. Al doilea tabel arată gradul în care cele două seturi de valori sunt corelate.4. divizată cu eroarea standard a mediei (0. Interpretarea output-ului.94. Media de -2.13 şi abaterea standard este 1. numărul de cazuri şi abaterea standard pentru cele două grupuri. Raportarea output-ului. X.126.

Compararea a două eşantioane de scoruri necorelate/nerelaţionate. de regulă. Procesarea unui Test t pentru eşantioane independente este ilustrată cu datele din tabelul următorcare arată valorile la un test de emotivitate pentru 10 74 . Testul t este în esenţă o procedură de testare a semnificaţiei diferenţei dintre două medii. permiţînd o estimare. de vreme ce starea populaţiei este. orice rezultat obţinut are o valoare relativă. Distribuţia teoretică de referinţă (distribuţia de nul) este cea normală. _________________________________________________________________________________________________________________ Atunci cînd o investigaţie de tip statistic se efectuează pe un eşantion. Testul t. Testul t pentru eşantioane independente este utilizat atunci când cele două seturi de variabile provin din două eşantioane diferite de oameni.Introducere în SPSS 2011 Mihaela Naidin XI. necunoscută. el este potrivit atunci când variabila dependentă este măsurată pe scală cantitativă (interval-raport). dar nici măcar nu se poate şti cu certitudine care este diferenţa dintre cele două genuri de date. în sensul că datele respective nu numai că nu coincid cu cele referitoare la populaţie. a marjei maxime de eroare ce se poate comite prin utilizarea mărimilor din eşantion în locul celor care caracterizează populaţia. Chiar dacă formulele de calcul sunt diferite. * Testul t pentru eşantioane independente este cel mai des folosit. Testul t pentru eşantioane independente este utilizat pentru a calcula dacă mediile pentru două seturi de variabile sunt diferite semnificativ una faţă de cealaltă. şi distribuţia t (Student). Teoria matematică a probabilităţilor oferă însă proceduri pentru evaluarea rezultatelor studiilor selective. pentru eşantioane mai mari de 30 de subiec ţi. pentru eşantioane mai mici de 30 de subiecţi. Ca urmare. forma de prezentare a rezultatelor şi ra ţionamentul decizional sunt similare pentru ambele situaţii. în termeni de probabilitate.

1. 75 . Datele nu sunt păstrate separat pentru cele două grupe. Introducerea datelor Pasul 1: În „Variable View” din „Data Editor”.Introducere în SPSS 2011 Mihaela Naidin copii care provin din familii biparentale şi 10 copii care provin din familii monoparentale. Astfel. Se etichetează al doilea rând „Emotivitate” (aici vor fi introduse rezultatele la testul de emotivitate). Cu alte cuvinte. Se înlătură cele două zecimale. Familii biparentale monoparentale 12 6 18 9 14 4 10 13 19 14 8 9 15 8 11 12 10 11 13 9 XI. Pasul 2: În „Data View” din „Data Editor” se introduc valorile pentru cele două variabile în primele două coloane. valorile 1 din prima coloană indică copii proveniţi din familiile biparentale şi valorile 2 indică copii proveniţi din familiile monoparentale. fiecare rând în parte reprezintă un anumit copil şi variabilele sale dependente şi independente sunt introduse separat în „Data Editor”. * Se observă că sunt două coloane de date: A doua coloană conţine cele 20 de valori ale testului de emotivitate de la ambele grupe de copii. este utilizată o singura variabilă dependentă (în cazul nostru „emotivitatea”) şi altă coloană pentru variabila independentă (familia). Scopul analizei este de a aprecia dacă valorile emotivităţii sunt diferite la copii care provin din familii cu doi părinţi faţă de copii care provin din familii monoparentale. se etichetează pe rând „Familii”. Aceasta va defini cele două tipuri de familii.

Introducere în SPSS 2011 Mihaela Naidin XI.3. Se selectează „Familie” şi apoi se apasă butonul ◄pentru a introduce această variabilă în căsuţa „Grouping Variable”. care reapare. Pasul 3: Se introduce: . Se selectează „Define Groups…” pentru a defini cele două grupuri. XI.2.valoarea 1 (codul pentru familiile biparentale) lături de eticheta „Group 1” . Se selectează „Continue” Se apasă „OK” din ecranul precedent. Efectuarea Testului t pentru eşantioane independente. Pasul 1: Se selectează: „Analyze” „Compare Means” „Independent Samples T test…” Pasul 2: Se selectează „Emotivitate” şi apoi se apasă butonul ► pentru a introduce această variabilă în lista variabilelor de test.valoarea 2 (codul pentru familiile monoparentale) alături de eticheta „Group 2”. Interpretarea output-ului. 76 .

Valoarea lui t este media diferenţei (3.500) divizată cu eroarea standard a diferenţei (1.Introducere în SPSS 2011 Mihaela Naidin Primul tabel arată . pentru fiecare grup în parte.031 pentru nivelul two-tailed.4. Dacă valoarea semnificaţiei pentru Testul Levene este mai mare de 0.00. întrebarea este dacă mediile diferă semnificativ.493).642) se foloseşte informaţia de pe acest prim rând. Raportarea output-ului.345. Rezultatele obţinute se pot raporta astfel: „Media pentru valorile testelor de emotivitate ale copiilor ce provin din familii cu doi părinţi este semnificativ mai mare decât cea a copiilor proveniţi din familiile cu un singur părinte”. media şi abaterea standard. numărul de cazuri. Dacă valoarea semnificaţiei pentru Testul Levene este mai mică de 0.05. 77 . Media pentru familiile biparentale este 13.345. XI. Pentru varianţe egale. se foloseşte informaţia de pe al doilea rând (al doilea rând oferă cifrele pentru cazul în care varianţele sunt diferite semnificativ). care la 18 grade de libertate este semnificativ la 0. t este 2. diviziune ce produce valoarea 2. După cum se observă există o diferenţă între cele două tipuri de familii. dar.05. lucru care se întâmplă aici (0.

00. 78 .Introducere în SPSS 2011 Mihaela Naidin Dacă se preferă folosirea intervalelor de încredere . SD=3.63.55) şi cei proveniţi din familii cu un singur părinte (M=9. Intervalul de încredere de 95% pentru această diferenţă este de la 0.50.00 diferenţa este statistic semnificativă la nivelul de semnificaţie twotailed de 5%. SD=3.50. se poate scrie: „Diferenţa dintre valorile testelor de emotivitate ale copiilor ce provin din familii cu doi părinţi (M=13.36 la 6.10) este de 3.Deoarece intervalul nu conţine punctul 0.

b. One sample T Test este un procedeu prin care: a. compară mediile pentru un singur grup observat în momente diferite d. coeficientul de corelaţie între cele două seturi este mare c. eşantioanelor independente c. 3. se compară mediile pentru un singur grup observat în momente diferite b. identificarea predictorilor pentru o variabilă numerică. Independent – Samples T Test se aplică în cazul: a. Testul t pentru eşantioane independente este utilizat atunci când: a. testează dacă mediile a două grupe sunt egale b. eşantioanelor dependente 2. cele două seturi de variabile provin din două eşantioane diferite de oameni. compară mediile pentru mai multe medii observate în momente diferite 6. b. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eşantion b. se testează dacă mediile a două grupe sunt egale c. se testează dacă media unei variabile este egală cu o constantă specificată b. 4. Testul „t” se foloseşte pentru: a. c.5. Independent – Samples T Test testează: a. Alegeţi răspunsul corect 1. compararea datelor de frecvenţă.Introducere în SPSS 2011 Mihaela Naidin XI. compararea a două seturi de date pentru identificarea diferenţelor. c. aceluiaşi eşantion b. testează dacă media unei variabile este egală cu o constantă specificată c. dacă se compară mediile pentru un singur grup observat la momente diferite. dacă mediile a două grupe sunt egale. Paired – Samples T test: a. se testează dacă mediile a două grupe diferă 5. 79 . dacă mediile a două grupe diferă.

este folosit pentru evaluarea semnificaţiei statistice a diferenţei dintre mediile pentru două seturi de scoruri. cele două seturi de variabile provin din două eşantioane diferite de oameni. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eşantion b. b. 80 . este potrivit atunci când variabila dependentă este măsurată pe scală cantitativă (interval-raport). c. Testul t: a.Introducere în SPSS 2011 Mihaela Naidin 7. este utilizat pentru a calcula dacă mediile pentru două seturi de variabile sunt diferite semnificativ una faţă de cealaltă. Testul t pentru eşantioane perechi este utilizat atunci când: a. 8. coeficientul de corelaţie între cele două seturi este mare c.

c. cele două seturi de variabile provin din două eşantioane diferite de oameni. este utilizat pentru a calcula dacă mediile pentru două seturi de variabile sunt diferite semnificativ una faţă de cealaltă. compară mediile pentru un singur grup observat în momente diferite 6. a. 81 . 4. 2.6. este potrivit atunci când variabila dependentă este măsurată pe scală cantitativă (interval-raport).Introducere în SPSS 2011 Mihaela Naidin XI. c. c. 5. 3. se testează dacă media unei variabile este egală cu o constantă specificată. este folosit pentru evaluarea semnificaţiei statistice a diferenţei dintre mediile pentru două seturi de scoruri. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eşantion b. Răspunsuri corecte 1. c. b. a. eşantioanelor independente. dacă mediile a două grupe sunt egale. 7. compararea a două seturi de date pentru identificarea diferenţelor. a. b. a. coeficientul de corelaţie între cele două seturi este mare 8.

1. Pasul 1: În meniul „Variable View” Se îndepărtează cele Se etichetează valorile din „Data Editor” se etichetează două zecimale. Acesta.Introducere în SPSS 2011 Mihaela Naidin XII. Niciodată acestea nu trebuie să fie transformate în procente pentru a fi introduse în SPSS. astfel încât frecvenţele totale să fie egale cu numărul persoanelor folosite în analiză. Tabel 1. *Testul chi-square analizează frecvenţe. Introducerea datelor din tabelul anterior folosind procedura „Weighing cases”. deoarece vor da rezultate eronate atunci când se vor calcula valoarea şi semnificaţia chi-square. „gen” şi „program”. analizează tabelele de asociere sau contingenţă pe baza a două variabile categoriale nominale. Testul Chi-Square. _________________________________________________________________________________________________________________ Diferenţe între frecvenţele eşantioanelor. Respondenţi Feminin Masculin Site-uri matrimoniale 27 17 anunţuri muzică 14 33 19 9 XII. Procesarea Testului chi-square folosind două sau mai multe eşantioane este exemplificată cu datele din tabelul anterior. primele trei coloane cu „gen biologic”. 82 . În general Testul chi-square este folosit pentru evaluarea existenţei unei diferenţe semnificative între două eşantioane formate din date de frecvenţă (date nominale). care arată care dintre cele trei tipuri de site-uri este preferat de către un eşantion de 119 adolescenţi de ambele sexe. „Site” şi „Frecvenţă”. * O analiză chi-square trebuie să includă datele fiecărui individ o singură dată. Relaţia dintre site-urile accesate şi genul biologic.

3. XII.Introducere în SPSS 2011 Mihaela Naidin Pasul 2: Se introduc valorile adecvate în meniul „Data View” din meniul „Data Editor”. Pasul 1: Se selectează: „Analyze” „descriptives statistics” „Crosstabs…”(tabele de asociere) 83 . „Weight cases by” şi apoi se apasă butonul ◄. Se apasă „OK”. Efectuarea Testului chi-square pe baza tabelului 1. XII. Paul 3: Pentru a pondera aceste celule se selectează: „Data” „Weight Cases…” Pasul 4: Se selectează „Frecvenţa”. Se introduc valorile pentru cele două variabile în fiecare dintre cele 119 cazuri. Fiecare rând reprezintă una dintre cele şase celule din tabelul prezentat anterior. Introducerea datelor din tabelul 1 caz cu caz.2.

Ser selectează „Statistics…” Pasul 3: Se selectează „Chi-square”. Se seletează „Continue”. Pasul 4: Se selectează „Cells.” Pasul 5: 84 .. Se selectează „Site” şi se apasă butonul ◄ pentru „Column(s)”: pentru a-l introduce în caseta respectivă.Introducere în SPSS 2011 Mihaela Naidin Pasul 2: Se selectează „Gen” şi se apasă butonul ► pentru „Row(s)”: pentru a-l introduce în caseta respectivă.

Se selectează „Unstandardized” în secţiunea „Residuals”. * Termenul „rezidual” se referă la diferenţe. Se selecteaze „Continue”. apoi se apasă „OK în ecranul anterior care reapare.Introducere în SPSS 2011 Mihaela Naidin În secţiunea „Counts” se selectează „Expected”. 85 .

gradele de libertate (2) şi semnificaţia two-tailed (0. Frecvenţele observate sunt întotdeauna numere întregi. Din moment ce această valoare este mai mică de 0. diferenţa dintre cele două valori fiind de – 4. Frecvenţa observată (numită „Count”) este prezentată prima.001). iar numărul anticipat de probabilitate este 21.8. şi ultimul indică valoarea coeficientului (Pearson) chi-square (13. Interpretarea output-ului pentru Testul chi-square. 86 .  Al doilea tabel indică frecvenţele observate şi cele aşteptate ale cazurilor şi diferenţa (valoarea reziduală) dintre acestea pentru fiecare celulă. frecvenţa aşteptată (Expected Count” şi diferenţa (Residual) dintre cele două pentru fiecare dintre cele şase celule ale tabelului.8.Introducere în SPSS 2011 Mihaela Naidin XII. coeficientul chi-square este semnificativ. apoi frecvenţa aşteptată (numită „Expected Count”. De exemplu: Frecvenţa sau numărul de fete care spun că preferă site-rile de matrimoniale este de 17. Al treilea tabel.518). astfel încât să fie uşor de localizat.4.05. Acest al doilea tabel din output indică frecvenţa (Count).

primul rând are 60 de cazuri.Introducere în SPSS 2011 Mihaela Naidin  Coloana finală din tabel etichetată „Total” conţine numărul de cazuri din respectivul rând. XII. gradul său de liberate şi nivelul său de semnificaţie sunt afişate în al treilea tabel care începe cu „Pearson” (cel care a elaborat acest test). urmat de numărul aşteptat de cazuri din tabel. este recomandat să se folosească testul Fisher. rândul final din acest tabel (etichetat „Total) prezintă mai întâi numărul de cazuri din respectiva coloană urmat de numărul aşteptat de cazuri din tabel pentru coloana respectivă. * Pentru o persoană neexperimentată aceste două posibilităţi de interpretare pot părea foarte diferite.5. număr care ca fi întotdeauna egal cu numărul aşteptat de cazuri (adică 44.0). urmat de numărul aşteptat de cazuri din tabel. număr care va fi identic numărului de cazuri aşteptate (adică 60). devine 13. rotunjită la un număr cu două zecimale. dar. care.0. Astfel primul rând are 60 de cazuri. atunci trebuie să se acorde foarte multă atenţie Testului chi-square. Valoarea chi-square este de 13. Astfel.  Sub acest tabel se mai poate vedea şi mărimea „minimum expected count” a oricărei celule din tabel. care este 13. Dacă diferenţa minimă aşteptată este mai mică decât 5. Există două modalităţi de descriere a rezultatelor.  În mod similar. Astfel.88 pentru ultima celulă (fetele care preferă site-urile cu muzică). practic. Raportarea output-ului pentru Testul chi-square. ele înseamnă acelaşi lucru.518.001. * Dacă se foloseşte un tabel 2x2 de tip chi-square şi apar frecvenţe anticipate reduse.52. pe care aplicaţia SPSS îl include în output în astfel de situaţii. Gradul său de libertate este 2. iar probabilitatea twotailed exactă este 0.  Valoarea chi-square. 87 . prima coloană are 44 de cazuri.

Introducere în SPSS 2011 Mihaela Naidin  Rezultatele se pot descrie astfel: „A existat o diferenţă semnificativă între frecvenţele observate şi cele aşteptate în cazul adolescenţilor băieţi şi fete în ceea ce priveşte preferinţa lor pentru cele trei tipuri de site-uri ( χ2 = 13. p = 0. p = 0.  Raportarea şi direcţia rezultatelor se poate face astfel: „ Fetele tind mai mult decât băieţii să prefere site-urile cu anunţuri (de toate genurile) şi preferă mai puţin site-urile despre matrimoniale sau pe cele cu muzică”.51.001)”.  O altă posibilitate de interpretare a rezultatelor obţinute ar putea fi: „ Există o asociere semnificativă între genul biologic şi tipul de site preferat ( χ2 = 13. DF = 2. 88 .51. DF = 2.001)”.

Recodificarea variabilelor. În acest caz se vor alege două grupe de vârstă: copii mai mici de 10 ani şi copii mai mari de 10 ani. Pentru a realiza această corelaţie este important să se stabilească numărul de grupe de vârstă dorite.Introducere în SPSS 2011 Mihaela Naidin XIII. Aplicaţia SPSS poate recodifica valori în mod rapid şi cu uşurinţă. Pasul 1: Se introduc datele aşa cum este prezentat în tabelul alăturat. Scorurile abilităţilor muzicale şi matematice obţinute de către un număr de 10 copii Scor muzică 3 7 8 9 9 6 4 3 4 7 Scor matematică 7 5 4 4 5 8 9 9 7 6 Gen biologic 1 1 2 1 2 2 2 1 2 1 Vârstă 10 9 12 8 11 13 7 10 9 11 * Scorurile abilităţilor muzicale şi matematice sunt aceleaşi care au fost prezentate anterior în capitolul VIII. Recodificarea rezultatelor. *Nu se modifică variabilele decât în cazul în care este absolut sigur că se doreşte modificarea permanentă a datelor originare. XIII. (Paşii de introducere a datelor sunt prezentaţi în capitolele anterioare). 89 . Dorim să se realizeze corelaţia dintre valorile abilităţilor muzicale şi a celor matematice. ceea ce îi oferă cercetătorului o mare libertate de recodificare a datelor. în cazul copiilor mici şi a celor mari.1.1.

Se selectează „Value” din meniul „new value” şi se scrie 1 în căsuţa alăturată. 90 . Se selectează „Change” pentru a adăuga acest nume nou în caseta „Numeric variable – Output Variable”. Pasul 4: Se selectează „Lowest through” şi se scrie 9 în caseta alăturată. Se introduce numele noii variabile. Se selectează „Old and New values”. Se selectează „Add” şi se introduce „lowest throught 9→1 „ în caseta „Old→New”. „recode” Şi „Into Different Variables” Pasul 3: Se selecteaă „Vârstă” şi se apasă butonul ◄ pentru a introduce „Vârsta” în caseta „Numeric Variable – Output variable”.Introducere în SPSS 2011 Mihaela Naidin Pasul 2: Se selectează „Transform”.

se selectează variabila pe care dorim să o recodificăm din lista variabilelor din partea stângă şi se mută în lista variabileor de recodat. Se apasă „OK” în ecranul care va reapărea. Casetele de editare sunt folosite pentru a stabili limita inferioară şi respectiv limita superioară a intervalului dorit.se scrie numele noii variabile în caseta Name din zona Output Variable. Pentru o astfel de recodificare se deschide fereastra Recode into Different Variables (din meniul Transform comanda Recode) în care: .se acţionează butonul de comandă Change pentru a se realiza modificarea. Pasul 6: Noua variabilă şi valorile sale sunt afişate în meniul „Data View”. . Se selectează „value” şi se scrie 2 în caseta alăturată. . Se selectează „Add” şi se introduce „10 through Highest→2” în caseta „Old→New”. În acest scop selectăm butonul de opţiuni Range. 91 .Introducere în SPSS 2011 Mihaela Naidin Pasul 5: Se selectează „Range: through highest” şi se scrie 10 în caseta de lângă el.se scrie în caseta Label eticheta noii variabile. Apoi se selectează butonul de opţiuni Value din zona New Value în care se introduce noua valoare şi acţionăm butonul Add. • 1 semnifică copii cu vârste mai mici de 10 ani • 2 semnifică copii cu vârste mai mari de 10 ani. . Pentru a defini categoriile variabilei numerice acţionăm butonul de comandă Old and New Values ce are ca efect deschiderea unei ferestre de dialog în care pentru a schimba o valoare particulară într-o valoare nouă se introduce valoarea veche în caseta Old Value şi valoarea nouă în caseta New Value şi se acţionează butonul Add. De regulă se schimbă o valoare reală cu altă valoare reală.

Pentru recodificarea în aceeaşi variabilă se selectează: a. transform/recode/into different variables. c. c. Comanda RECODE permite: a. 2. transform/recode/into different variables. b. testează egalitatea unei proporţii cu o valoare specificată c. XIII. recodificarea într-o variabilă diferită sau în aceeaşi variabilă. Chi – Square a. Pentru recodificarea într-o variabilă diferită se selectează: 92 . b. Alegeţi răspunsul corect 1. tranformarea unei variabile prin divizarea valorilor acesteia într-un număr mai mare de categorii. Comanda RECODE se găseşte în meniul: a. ambele variante de mai sus. testează egalitatea mediilor a două eşantioane independente d. 3. testează egalitatea a două sau mai multe proporţii b.Introducere în SPSS 2011 Mihaela Naidin Prin clic pe butonul de comandă Continue se revine în fereastra Record into Different Variables în care acţionăm OK pentru recodificarea variabilei. c. 5. b. transform/recode/into same variables. testează egalitatea mediilor a două eşantioane perechi 4. transform/recode/into same variables. nicio variantă de mai sus.2. combinarea valorilor acestei variabile cu scopul creării unei alte serii.

a. c. a. a. transform/recode/into different variables. testează egalitatea a două sau mai multe proporţii 4. 5. XIII. nicio variantă de mai sus.Introducere în SPSS 2011 Mihaela Naidin a. b. c. 3. transform/recode/into different variables. transform/recode/into same variables. 93 . 2. ambele variante de mai sus. b. Răspunsuri corecte 1. transform/recode/into same variables. recodificarea într-o variabilă diferită sau în aceeaşi variabilă.3.

se folosesc mai multe întrebări pentru a măsura mai mult sau mai puţin acelaşi lucru. Exemplu: Se doreşte să se adune câteva întrebări dintr-un chestionar. total dezacord. _________________________________________________________________________________________________________________ Calculul variabilelor noi permite adunarea.Introducere în SPSS 2011 Mihaela Naidin XIV. 2. 4. Participanţilor li se cere să afirme în ce măsură sunt de acord cu fiecare dintre aceste afirmaţii. a valorilor câtorva variabile pentru a obţine o nouă variabilă. Uneori stresul de la serviciu devine insuportabil. b. întru totul de acord. de acord. dezacord. pentru a obţine un indice general al ceea ce măsoară chestionarul. d. Viitorul pare promiţător la locul de muncă. 3. c. Unii colegi sunt enervanţi câteodată. De exemplu. etc. pe următoarea scală de la 1 la 4: 1. Calculul variabilelor noi. 94 . următoarele afirmaţii pot fi folosite pentru evaluarea satisfacţiei profesională: a. În general mă bucură profesia mea. Atunci când sunt măsurate variabilele psihologice. scăderea.

dezacord. de acord. Procedura unei variabile noi. XIV. 95 . scor total. Se scrie sau se selectează termenii expresiei şi se introduc în caseta „Numeric Expression”. prin adunarea răspunsurilor date tuturor celor patru afirmaţii. astfel: 4. Se apasă „OK”. Pasul 4: Pentru a salva această procedură sub formă de fişier de sintaxă. Se selectează „Paste” pentru a salva această procedură sub formă de sintaxă. se selectează „Paste” în caseta principală. total de acord.Introducere în SPSS 2011 Mihaela Naidin Aceşti itemi se pot folosi pentru a determina nivelul de satisfacţie profesională a angajaţilor. 2. total dezacord. 3. Pasul 1: Se scrie un nume pentru noua variabilă în caseta de sub „Target Variable” (ex. se va inversa evaluarea. 1.1. Întru totul De acord de acord dezacord Total dezacord Respondent 1 Respondent 2 Respondent 3 Deoarece este nevoie de scoruri mari pentru a indica satisfacţia profesională.

Testele rangurilor. care a fost folosit şi în 96 .Introducere în SPSS 2011 Mihaela Naidin Această comandă de sintaxă va apărea în fereastra „Syntax”. Aceste teste fac mai puţine presupuneri referitoare la caracteristicile populaţiei de la care provin datele. În acest capitol vom vorbi despre Testul semnului şi Testul Wilcoxon pentru date corelate (eşantioane perechi). prin aceste metode se verifică dacă rangurile dintr-un grup sunt mai mari sau mai mici decât rangurile din celălalt grup. XV. Testul U Mann-Witney se foloseşte pentru date nerelaţionate. acesta fiind echivalentul nonparametric al Testului pentru eşantioane independente. deoarece acestea folosesc scoruri transformate în ranguri. _________________________________________________________________________________________________________________ Statistici nonparametrice. De obicei. Procesarea a două teste nonparametrice pentru scoruri relaţionate este exemplificată folosind datele din tabelul următor. Testele nonparametrice sunt folosite atunci când nu este îndeplinită condiţia ca scorurile fiecărei variabile să fie cât de cât normal distribuite (în formă de clopot). Metodele statistice nonparametrice nu testează diferenţele dintre medii. aceste teste sunt echivalentele nonparametrice ale Testului t pentru eşantioane perechi. trăsătură care nu este caracteristică testelor parametrice (cum ar fi Testul t). Cu alte cuvinte.

1. Pasul 2: Se selectează: „Analyze” „Nonparametric Tests” „2 Related Samples…” Pasul 3: Se selectează „Optsprezece” şi „douăzecisipatru” şi se apasă butonul ◄ pentru a introduce aceste două variabile în caseta „Test Pair(s) List”. Pasul 1: În „Data View” din „Data Editor” se introduc datele în primele două coloane.Introducere în SPSS 2011 Mihaela Naidin capitolul X şi care indică numărul de cuvinte pe care aceeaşi copii le-au verbalizat cu mamele lor la 18 luni şi la 24 luni. Numărul de cuvinte verbalizate într-un minut la vârste diferite. Scoruri relaţionate: testul semnului. 18 luni 24 luni Alina 3 5 Cristina Raluca Carmen Simona Radu 2 4 5 2 3 4 7 8 3 4 Cristi 2 4 Dan 4 6 XV. 97 .

Al doilea tabel indică nivelul de semnificaţie al acestui test. XV. Se apasă „OK”. Raportarea output-ului pentru testul semnului. se selectează din nou. 98 . Probabilitatea two-tailed este de 0.4. Se selectează „Sign”. Testul Wilcoxon reprezintă opţiunea predefinită în caseta de dialog a testelor cu două eşantioane perechi. Rezultatele obţinute pot fi raportate astfel: „Există o schimbare semnificativă la nivelul numărului de cuvinte verbalizate de la 18 luni la 24 de luni (Testul semnului: N=0.5.008 ceea ce este semnificativ la nivelul de 5%.Introducere în SPSS 2011 Mihaela Naidin Se deselectează „Wilcoxon”. Interpretarea output-ului pentru Testul Wilcoxon. Interpretarea output-ului pentru testul semnului.2.3. XV. XV. pozitive (8) şi inexistente (0) în ceea ce priveşte numărul de cuvinte verbalizate la cele două vârste. Scoruri relaţionate: testul Wilcoxon. Se apasă „OK” pentru a obţine output-ul Testului Wilcoxon. Se poate ignora primul dintre cele două tabele care indică numărul de diferenţe negative (0). XV.008). Dacă s-a deselectat anterior.

011.7. Valorile pentru „două zeci şi patru „ de luni sunt mai mari decât cele pentru „optsprezece” luni. care indică scoruri ale emotivităţii obţinute de 99 . z =2. vom folosi datele din tabelul următor.Introducere în SPSS 2011 Mihaela Naidin Se poate ignora primul dintre cele două tabele de output. pozitive (8) şi inexistente (0) în ceea ce priveşte datele ordonate după cele două vârste. Aceasta înseamnă că diferenţele dintre cele două variabile sunt semnificative din punct de vedere statistic la un nivel de 5%. care are o probabilitate two-tailed de 0. Scoruri nerelaţionate: Testul U Mann-Whitney. XV. Raportarea output-ului pentru Testul Wilcoxon.56. Rezultatele obţinute pot fi raportate astfel: „Există o diferenţă semnificativă între numărul de cuvinte verbalizate de copii între 18 şi 24 de luni (Wilcoxon: N=8. Scorul Z este de – 2. Al doilea tabel indică nivelul de semnificaţie al acestui test. Pentru procesarea unui test nonparametric pentru scoruri necorelate. În loc să folosească tabelul valorilor critice. computerul utilizează o formulă care stabileşte o conexiune cu distribuţia Z. two-tailed p = 0. şi media şi suma catalogate negative şi pozitive. XV.6. Acestea indică numărul de diferenţe negative (0).011)”.558.

Familii biparentale monoparentale 12 6 18 9 14 4 10 13 19 14 8 9 15 8 11 12 10 11 13 9 Pasul 1: . Pasul 2: Se selectează: „Analyze” „Nonparametric tests” „2 Independent Samples… Pasul 3: Se selectează „Emotivitate” şi se apasă butonul ►pentru a introduce parametrul „Emotivitate” în caseta „Test Variable List”.este acelaşi ca şi cel prezenta la capitolul XI.Introducere în SPSS 2011 Mihaela Naidin 10 copii care provin din familii biparentale şi 10 copii care provin din familii monoparentale. 100 . Se selectează „Familie” şi se apasă butonul ◄pentru a introduce „Familie” în caseta „Grouping Variables”.

Interpretarea output-ului pentru testul U Mann-Whitney. Computerul a listat şi un scor Z de -2. Se scrie 2 (pentru 2 părinţi) în caseta de lângă „Group 2”. Al doilea tabel indică statistica de bază mannWhitney. După cum se poate 101 . iar rangul mediu pentru al doilea grup (adică valoarea 1) este de 7. Se selectează „Continue”. Aceasta înseamnă că valorile din grupul 2 (biparentale) au tendinţa să fie mai mari decât cele din grupul 1 (monoparentale).011.8.85.043.044.500. care este semnificativ la nivel de 0.Introducere în SPSS 2011 Mihaela Naidin Se selectează „Define Groups…” Pasul 4: Se scrie 1 (pentru un singur părinte) în c aseta de lângă „Group 1”.15. Se apasă „OK” din ecranul anterior care va reapărea. XV. Aceasta este valoarea Testului Mann-Whitney atunci când se aplică o corecţie pentru ranguri înrudite. Se poate ignora primul dintre cele două tabele de output. ceea ce este semnificativ din punct de vedere statistic la un nivel de 0. Acest tabel indică faptul că rangul mediu dat parametrului „Emotivitate” pentru primul grup (adică valoarea 2) este 13. valoarea U fiind de 23.

aceasta a modificat nivelul de semnificaţie doar marginal. Analiza de varianţă (ANOVA). p two-tailed p= 0. Analiza de varianţă calculează variaţia dintre scoruri şi pe cea dintre mediile eşantioanelor.5. testul t independent este un tip special de ANOVA simpla în care sunt implicate doar doua grupe. 102 .iliile cu doi părinţi sunt semnificativ mai mari decât la cei din familiile cu un singur părinte (U=23. *Grupurile diferite aparţin variabilei independente iar valorile numerice corespund variabilei dependente.2=10. Analiza de varianţă cu scoruri nerelaţionate/necorelate indică măsura în care câteva (două sau mai multe) grupuri au medii foarte diferite. N1. deoarece cele două grupuri de caz pot fi acoperite de u un T-test. Rezultatele obţinute în urma acestei analize se pot raporta astfel: „ Testul U Mann-Whitney a concluzionat că scorurile emotivităţii la copii din fa.44 la 0.Introducere în SPSS 2011 Mihaela Naidin vedea. One – way ANOVA este folosit pentru testare pentru diferenţele între două sau mai multe grupe independente.44. ANOVA este utilizat pentru a testa diferenţe între cel puţin trei grupuri. XV. XVI. De fapt. _________________________________________________________________________________________________________________ Introducere în metoda one-way ANOVA cu scoruri nerelaţionate sau necorelate. ANOVA simpla permite evaluarea ipotezei nule între mediile a doua sau mai multe serii de date cu restricţia ca acestea sa fie trepte ale aceleiaşi variabile independente. de la 0.9 Raportarea output-ului pentru Testul U Mann-Whitney.044)”.

Introducere în SPSS 2011 Mihaela Naidin ANOVA simpla permite compararea simultana a trei sau mai multe grupe menţinând nivelul α la valoarea dorita. Metoda one-way ANOVA pentru eşantioane independente. Pasul 2: Se selectează: „Analyze” 103 . Este vorba despre un studiu asupra efectului unor tratamente hormonale şi placebo asupra depresiei. de maxim 0. Se codifică cele trei condiţii cu valorile 1. „Hormon 2” şi „Placebo”. Procesarea analizei one-way de varianţă cu scoruri nerelaţionate este exemplificată folosind datele din tabelul următor. Pasul 1: Se introduc datele. Se etichetează „Hormon 1”. 2. care indică rezultatele obţinute de către diferiţi participanţi în condiţii diferite. Date studiu Grup 1 Grup 2 Tratament hormonal Tratament hormonal 8 4 11 2 8 4 Grup 3 Placebo 4 6 4 XVI. 3.05. Astfel. medicamentul este variabila independentă şi depresia este variabila dependentă.1.

Pasul 3: Se selectează „depresie” şi se apasă butonul ►de lângă caseta „Dependent List” – pentru a introduce parametrul în casetă. XVI. 104 .Introducere în SPSS 2011 Mihaela Naidin „Comparea Means” „One-Way ANOVA”. Se selectează „Continue…”. cum ar fi numărul de cazuri. Se apasă „OK” din ecranul anterior. Primul tabel oferă diferite statistici descriptive. media şi abaterea standard în cele trei condiţii şi pe eşantionul total. care va reapărea.2. Se selectează „Options… Pasul 4: Se selectează metodele statistice „descriptive” şi „Momogenity of variance test”. Se selectează „Condiţie” şi se apasă butonul ◄ de lângă caseta „Factor” – pentru a introduce parametrul acolo. Interpretarea output-ului.

00).6 = 13.  Aceasta înseamnă că există o diferenţă semnificativă între cele trei grupuri.00.441. Rezultatele obţinute pot fi raportate astfel: „Per total. este împărţită suma pătratelor de la media din interiorul grupelor (sum of squares groups)m ceea ce dă un Raport F de 13. efectul tratamentului cu medicamente a fost semnificativ (F2. Raportarea ouput-ului.941 (20. XVI. acesta fiind mai mic decât 0. Raportul F este semnificativ la nivel de 0.941). 105 .94. Al treilea tabel indică rezultatele analizei de varianţă. Acest test nu este semnificativ deoarece are o semnificaţie de 0.3.  Raportul F se calculează prin împărţirea „sum of square” (suma pătratelor abaterilor de la medie) dintre grupe. nu a existat nicio diferenţă semnificativă între media controlului placebo şi media tratamentului hormonal 2. p= 0.889 = 13. În schimb.05.333/0.Introducere în SPSS 2011 Mihaela Naidin Al doilea tabel oferă rezultatele Testului Levene al similarităţii varianţelor.

Scopul acestei analize este acela de a aprecia dacă diferitele combinaţii de cafea şi deprivare de somn afectează diferenţiat numărul mediu de greşeli făcute. Analiza de varianţă bifactorială pentru _________________________________________________________________________________________________________________ scoruri nerelaţionate/necorelate. Datele pentru un experiment referitor la privarea de somn: Numărul de erori în cazul unui test video. Analiza two-way de varianţă permite compararea mediilor unei variabile dependente atunci când există două variabile independente. 106 . Realizarea unei analize two-way pentru scoruri nerelaţionate de varianţă este exemplificată în tabelul următor. care indică scorurile obţinute de către diferiţi participanţi în şase condiţii. Dacă există mai mult de o variabilă dependentă. atunci analiza se realizează separat pentru fiecare variabilă. reflectând cei doi factori ai privării de somn şi alcool.Introducere în SPSS 2011 Mihaela Naidin XVII.

Greşelile sunt prezentate în a treia coloană. Se elimină cele două zecimale din mediul „Variable View”. Cele ouă coduri pentru „Alcool” (1=alcool. 2= 6 ore. 2= fără alcool) – în prima coloană. Pasul 2: Se selectează: „Analyze” „General Linear Model” „Univariate…” 107 . Pasul 1: Se introduc datele.1.Introducere în SPSS 3 ore 14 10 15 9 9 12 2011 privare de somn 6 ore 16 14 23 11 8 11 Mihaela Naidin 9 ore 20 22 30 10 14 12 Consum alcool Fără alcool XVII. Cele trei coduri pentru „Privare de somn” se regăsesc în a doua coloană (1= 3 ore. Metoda two-way ANOVA pentru scoruri nerelaţionate. 3= 9 ore).

Se selectează „Continue”. În ecranul anterior. Se selectează „Privare de somn” şi se apasă 108 . Se selectează „Alcool” şi „Privare de somn” fie împreună. şi se apasă butonul „Fixed factor(s)” pentru a le introduce în casetă. care va reapărea.Introducere în SPSS 2011 Mihaela Naidin Pasul 3: Se selectează „Erori” şi se apasă butonul ► de lângă caseta „Dependent Variable”pentru a introduce parametrul acolo. Se selectează „Options…” Pasul 4: Se selectează „Descriptives statistics” şi „Homogeneity test”. fie separat. se selectează „Plots…”. Pasul 5: Se selectează „Alcool” şi se apasă butonul ► de lângă caseta „Horizontal axis” – pentru a introduce parametrul acolo.

Acest tabel conţine mediile . Din moment ce semnificaţia acestui test este 0. care verifică similaritatea varianţelor. Interpretarea output-ului. Luate separat sau împreună. XVII.50).085 (valoarea care este mai mare decât 0.2. Se apasă „OK” din ecranul anterior care va reapărea.pentru a introduce opţiunea în casetă. varianţele sunt similare Al patrulea tabel indică nivelele de semnificaţie 109 . abaterile standard şi numărul (N) de cazuri pentru cele două variabile „Alcool” şi „Privare de somn”.Introducere în SPSS 2011 Mihaela Naidin butonul ◄ de lângă caseta „Separate Lines” .22). Media pentru privare de 3 ore de somn este comparată cu „Total” pentru „Alcool” (adică 11. Se selectează „Continue”. Se selectează „Add” . Al treilea tabel de oferă informaţii referitoare la Testul Levene.05). Media pentru condiţia „Alcool” este comparată cu „Totalul” pentru „Privare de somn” (adică 18.

 Pentru prima variabilă.00 12.50 15.  raportul F pentru interacţiunile dintre cele două variabile (Alcool şi Privare de somn) este de 2. valoare care are un nivel exact de semnificaţie de 0.891.00 alcool fara alcool alcool 110 . aceasta este egală cu 5.000. ceea ce înseamnă că mediile celor trei condiţii legate de somn nu sunt similare. se poate conhide că scorul mediu al uneia dintre condiţii este mult mai mare decât pentru cealaltă.50 10. Raportul f este semnificativ din punct de vedere statistic la un nivel de 0.  În tabelul de analiză a varianţei. cum este Testul t pentru eşantioane independente. Astfel. Acest grafic este realizat pentru mediile celor şase condiţii.107→ nu este nicio interacţiune semnificativă.797. Estimated Marginal Means of erori privare de somn 3 ore 22. Deoarece sunt numai două condiţii pentru ca acest efect să se producă. El a fost editat cu ajutorul comenzii “Chart Editor”.05. ceea ce este semnificativ la nivelul 0.  Pentru a doua variabilă a privării de somn. raportul F pentru cele două efecte principale (Alcool şi Privare de somn) este prezentat primul. cea a alcoolului.Introducere în SPSS 2011 Mihaela Naidin pentru cele două variabile „Alcool” şi „Privare de somn”. şi interacţiunea dintre acestea.  Mediile care diferă de celelalte pot fi determinate ulterior prin folosirea testelor de comparaţii multiple.017.00 17.50 6 ore 9 ore Estimated Marginal Means 20. Raportul F este 22.708 → nivelul de semnificaţie al acestui raport este de 0.

p< 0. dar nu şi în cazul interacţiunii celor două variabile (F =2.001) şi al privării de somn (F=5.Introducere în SPSS 2011 Mihaela Naidin XVII.3.017). p = 0.981. 111 .70. p= 0.80.  Rezultatele din output se pot raporta astfel: „O analiză de varianţă two-way ANOVA demonstrează obţinerea unor efecte semnificative în cazul alcoolului (F = 22.107). Raportarea output-ului.

„Hormon 2” şi „Placebo”. Se codifică cele trei condiţii cu valorile 1. Pentru a prezenta această procedură vor fi folosite informaţiile prezentate la capitolul XV. 112 . Date studiu Grup 1 Grup 2 Tratament hormonal Tratament hormonal 8 4 11 2 8 4 Grup 3 Placebo 4 6 4 Pasul 1: Se introduc datele. _________________________________________________________________________________________________________________ Acest capitol extinde aria de acoperire a Testelor t multiple prezentate în capitolele anterioare şi explică modul în care se decide care perechi de medii sunt diferite în mod semnificativ între ele. 2. Se etichetează „Hormon 1”. Această tehnică se foloseşte atunci când sunt mai mult de două medii. 3. Comparaţii multiple cu ANOVA. Pasul 2: Se selectează: „Analyze” „Comparea Means” „One-Way ANOVA”.Introducere în SPSS 2011 Mihaela Naidin XVIII. în cazul analizei de varianţă.

Se selectează „Post Hoc…” Pasul 4: Se selectează: „Tukey” „Duncan” „Scheffe”. Se apasă „Continue”. 113 . Se selectează „Condiţie” şi se apasă butonul ◄ de lângă caseta „Factor” – pentru a introduce parametrul acolo. XVIII. Se selectează „OK” în ecranul care va apărea din nou. Interpretarea output-ului.1.Introducere în SPSS 2011 Mihaela Naidin Pasul 3: Se selectează „depresie” şi se apasă butonul ►de lângă caseta „Dependent List” – pentru a introduce parametrul în casetă.

mediile pentru cele trei grupuri diferă. care are un nivel exact de semnificaţie de 0. ceea ce înseamnă că nu sunt semnificativ diferite. motiv pentru care aceasta este semnificativ diferită de mediile celorlalte două 114 .006. Acest lucru înseamnă că efectul dintre grupuri este semnificativ.020). Grupul hormonului 1 este singurul din această a doua subgrupă.Introducere în SPSS 2011 Mihaela Naidin Primul tabel reprezintă rezultatele analizei de varianţă. Grupul hormonului 2 şi al controlului Placebo aparţin aceleiaşi subgrupe. Dacă se foloseşte Testul Tukey al diferenţei semnificative oneste (HSD). Subgrupele omogene.941. media de la grupul hormonului 1 este semnificativ diferită de media de la grupul hormonului 2 (semnificaţia=0. Al doilea tabel şi ultimul oferă rezultatele celor trei teste de comparaţii multiple. per total.06) şi semnificaţia de la media grupului Controlului placebo (semnificaţia=0. Raportul F pentru efectul dintre grupuri (adică efectul hormonilor) este 13.

în valoare de 9. cât şi de cea a gupelor de control placebo.67 nu diferă semnificativ. p= 0. Dacă se ia în calcul aceste două rânduri pentru a se folosi în Testul Tukey HSD.2. dar nu s-au mai găsit alte diferenţe semnificative”. 115 . Prin Metoda Scheffe de analiză a intervalului s-a descoperit că grupul hormonului 1 era diferit de grupul hormonului 2 (p= 0. enumeră grupurile de medii care nu sunt semnificativ diferite între ele. în acest caz există două subgrupe de medii. XVIII.33 şi 4.06).00. media grupului hormonului 1 este semnificativ diferită atât de media grupei hormonului 2.07) şi de grupul controlului placebo (p=0. numit „Subgrupele omogene”.24). Raportarea output-ului. Astfel.  Toate cele trei teste prin comparaţii multiple sugerează acelaşi lucru: faptul că există diferenţe semnificative între grupele hormonului 1 şi hormonului 2 şi între grupele hormonului 1 şi cele ale controlului placebo. Subgrupa 1 indică faptul că mediile grupelor hormonului 2 şi ale controlului placebo cu valorile 3.Introducere în SPSS 2011 Mihaela Naidin grupe. Foloseşte Media armonică a dimensiunilor eşantioanelor =3. Rezultatele output-ului pot fi raportate astfel: „O analiză de varianţă unifactorială pentru scoruri necorelate a demonstrat producerea unui efect general semnificativ pe tip de tratament medicamentos (F=13. Alte diferenţe nu mai există. Subgrupa 2 conţine doar media grupei hormonului 1.000.94. a.  Tabelul final. * Sunt reprezentate mediile grupelor din subgrupele omogene.

compararea mediilor unei variabile dependente atunci când există două variabile independente. a testa diferenţa între cel puţin 2 grupuri. ANOVA este utilizată pentru: a. 116 . 2. b. b. c. b. se foloseşte atunci când sunt mai mult de două medii. a. calculează variaţia dintre două scoruri. explică modul în care se decise care perechi de medii sunt diferite în mod semnificativ între ele. indică măsura în care două sau mai multe grupuri au medii foarte diferite. b. 4. c. c. calculează variaţia dintre mediile eşantionului. Alegeţi răspunsul corect 1.2. înmulţirea şi împărţirea. c. compararea mediilor dintre două grupuri. c. a testa diferenţa între cel puţin 4 grupuri. ambele variante de mai sus. 3. compararea mediilor unor variabile independente. Comparaţiile multiple cu ANOVA: a. indică scorurile obţinute de respondenţi. Calculul variabilelor noi: adunarea şi scăderea.Introducere în SPSS 2011 Mihaela Naidin XIII. Analiza two-way de varianţă permite: a. a testa diferenţa între cel puţin 3 grupuri. Analiza de varianţă (ANOVA): a. b. 5.

Răspunsuri corecte 1. c. testa diferenţa între cel puţin 3 grupuri.3. explică modul în care se decise care perechi de medii sunt diferite în mod semnificativ între ele. compararea mediilor unei variabile dependente atunci când există două variabile independente. b. c. a.Introducere în SPSS 2011 Mihaela Naidin XIII. 4. ambele variante de mai sus. 5. indică măsura în care două sau mai multe grupuri au medii foarte diferite. a. se foloseşte atunci când sunt mai mult de două medii. b. 117 . 2. 3.

Introducere în SPSS 2011 Mihaela Naidin 118 .

Sign up to vote on this title
UsefulNot useful