Aplicaţii SPSS

Marian Popa

MARIAN POPA...................................................................................................1
SPSS prezentare generală...................................................................................................................................3 ................................................................................................................................................................................6 Paşii analizei statistice cu SPSS..........................................................................................................................6 Editarea datelor....................................................................................................................................................8 Exemplu practic de realizare a unei baze de date..........................................................................................15 Operaţii de transformare a variabilelor..........................................................................................................19 Însumarea valorilor variabilelor................................................................................................................19

.........................................................................................................................21
Calcularea mediei a două sau mai multe variabile....................................................................................21 Extragerea anului dintr-o variabilă de tip cronologic (date) ....................................................................22 Recodificarea variabilelor.........................................................................................................................24 Ordonarea după rang a valorilor unei variabile........................................................................................26 Organizarea datelor pentru analiză.................................................................................................................27 Sortarea bazei de date...............................................................................................................................27 Împărţirea bazei de date în subgrupuri......................................................................................................28 Selectarea unor seturi de date....................................................................................................................28 Calcularea indicatorilor statistici descriptivi..................................................................................................31 Teste parametrice...............................................................................................................................................35 Testul z (t) pentru media unui singur eşantion .........................................................................................35 Testul t pentru eşantioane independente...................................................................................................37 Analiza de varianţă unifactorială (One Way ANOVA)............................................................................40 Testul t pentru eşantioane dependente (perechi).......................................................................................44 Coeficientul de corelaţie liniară Pearson (r).............................................................................................46 Regresia liniară simplă..............................................................................................................................51 Analiza de consistenţă internă (Cronbach alfa)........................................................................................57 Teste neparametrice nominale..........................................................................................................................65 Testul z al proporţiei pentru un singur eşantion........................................................................................65 Testul semnelor.........................................................................................................................................67 Testul Chi-pătrat al asocierii (independeţei).............................................................................................69 Testul Chi-pătrat pentru corespondenţă (goodness of fit).........................................................................72 Testul z al diferenţei dintre două proporţii independente.........................................................................74 Teste neparametrice pentru date ordinale......................................................................................................77 Testul Mann-Whitney (U) pentru două eşantioane independente............................................................77 Testul Wilcoxon pentru două eşantioane perechi.....................................................................................79 Testul Kruskal-Wallis pentru mai mult de două eşantioane independente...............................................81 Testul Friedman pentru măsurări repetate................................................................................................83 Coeficientul de corelaţie pentru date ordinale (Spearman).......................................................................84

-2-

SPSS prezentare generală
„SPSS for Windows” este un pachet de programe destinat analizei statistice a datelor. Deşi există o varietate de programe de acest gen (SAS, Statistica for Windows, GraphPad, MS Excel, care are şi el funcţii statistice), SPSS se distinge prin structurarea riguroasă şi uşurinţa utilizării, chiar şi pentru începători. Cea mai recentă versiune disponibilă la această dată este SPSS 12.0. Acest manual nu acoperă în mod special o anumită versiune, ci face referire în general la versiunile sub Windows. În esenţă, toate versiunile sub Windows oferă acelaşi pachet de funcţii statistice iar diferenţele, chiar dacă sunt, nu sunt relevante la nivelul unui curs introductiv de statistică.  Simbolul care precede această propoziţie indică introducerea unei informaţii importante, care se impune a fi reţinută.  Ne vom axa pe o prezentare sintetică, axată pe esenţial, considerând cunoscute elementele de bază de operare în mediul Windows.
Funcţii de bază ale SPSS

   

editarea datelor (construirea bazelor de date, transformări ale variabilelor) prelucrarea statistică a datelor (statistici descriptive, teste de semnificaţie) prezentarea rezultatelor, sub formă numerică sau grafică realizarea unor proceduri proprii de prelucrare sau de a modifica procedurile standard SPSS. Această opţiune este rezervată utilizatorilor avansaţi şi nu va face obiectul prezentării în acest manual.

Domeniile de lucru în SPSS Particularitatea principală a interfeţei de lucru cu SPSS este aceea că rezervă fiecăreia dintre funcţiile de mai sus un domeniu special („ecran”, sau „fereastră”). Astfel, la lansarea programului, acesta deschide automat o fereastra rezervată editării datelor (Data Editor) şi una afişării rezultatelor (Viewer). Putem numi aceste ferestre şi domenii de lucru, deoarece la nivelul fiecăruia avem la dispoziţie o varietate de funcţii şi opţiuni specifice. Ca să înţelegem mai bine, trebuie să ne imaginăm „domeniile de lucru” ca fiind „ferestre” distincte, similare celor ale documentelor Word, cu deosebirea că, în acest caz, fiecare fereastra acoperă funcţii specifice. Trecerea de la o fereastră la alta se face într-unul din următoarele moduri:  Din meniul SPSS/Windows, prin alegerea ferestrei dorite;  Utilizând butoanele din bara de comenzi directe a ferestrei SPSS;  Utilizând butoanele de pe bara de sarcini a sistemului de operare (din partea de jos a ecranului).

-3-

Domeniul bazei de date (Data Editor) La lansarea programului SPSS se deschide fereastra domeniului de editare a datelor (SPSS Data Editor). Ea se prezintă ca în imaginea de mai jos, având caracteristicile obişnuite ale unei ferestre Windows, cu o structură de linii şi coloane: - pe coloane sunt variabilele (de ex., cod_sub, rezultat) - pe linii sunt cazurile (în acest caz, cinci subiecţi)

 O sesiune de lucru cu SPSS presupune, în mod necesar, existenţa unei baze de date.  SPSS operează cu o singură bază de date la un moment dat.  Pentru a deschide o altă bază de date, sau a crea una nouă, cea aflată în lucru va fi închisă. Programul solicită salvarea ei prealabilă, dacă acest lucru nu a fost deja efectuat.  Dacă vrem să prelucrăm date aflate în baze de date (fişiere) diferite, este necesară aducerea lor în aceeaşi bază de date (procedura DATA-Merge files, care va fi descrisă mai târziu).  Meniurile ferestrei Data Editor nu se vor activa integral decât atunci când va exista cel puţin o variabilă definită şi valori pentru cel puţin un caz.  Baza de date SPSS poate fi creată direct, cu ajutorul structurii (ferestrei) Data Editor, sau poate fi deschisă cu ajutorul comenzii File-Open, aşa cum vom exemplifica mai târziu. Domeniul afişării rezultatelor (Viwer) SPSS depune rezultatele prelucrărilor într-o secţiune aparte a domeniului de lucru. Aceasta cuprinde toate tipurile de rezultate, atât de tip numeric cât şi de tip grafic. Fereastra respectivă (Viewer) este organizată în două zone distincte: una pentru navigare (în partea stângă) şi alta pentru afişarea rezultatelor (în partea dreaptă).

-4-

 Utilizarea directă a procedurilor impune aprofundarea SPSS  Se poate seta afişarea procedurilor curente în SPSS Viewer. fie la transferarea prin Select/Copy/Paste într-un editor grafic de tipul MS Word. pe de o parte. Domeniul de editare a procedurilor directe (Syntax) SPSS permite. concomitent cu rezultatele. editarea procedurilor. Aceasta se face în interiorul unei ferestre speciale. în afara operării prin intermediul mediurilor.SPO  Un fişier cu rezultate SPSS nu poate fi deschis decât din SPSS  Dacă se doreşte transmiterea rezultatelor în afară SPSS se va proceda fie la „exportul” rezultatelor cu procedura corespunzătoare din meniul File/Export. şi lucrul direct cu proceduri definite de utilizator. Imaginea de mai jos redă comenzile SPSS pentru calcularea procedurii de calcul indicatorilor statistici descriptivi. (Edit/Options/Viewe/Display commands in the log) -5- . Fişierul rezultat prin salvarea acestei ferestre are extensia . care permite. redaţi mai sus. în fereastra SPSS Viewer. lansare lor în execuţie. iar pe de altă parte.

ştergere. cel Edit mai important. etc. structurare pe Utilities seturi de variabile Lista ferestrelor deschise cu posibilitatea de Window selecţie Aici se află un tutorial extrem de sugestiv de operare cu SPSS. vederea prelucrării Importante pentru Funcţii de modificare a datelor prin calculare. vederea prelucrării Prin opţiunile fiecărei Statistics proceduri se pot obţine şi Grupează procedurile de calcul statistic (Analyze) reprezentări grafice specifice Graph Grupează procedurile de reprezentare grafică Informaţii despre variabile. sortare. setarea caracteristicilor de lucru ale SPSS (Options-în versiunile pt. iată o prezentare succintă a meniurilor pentru fereastra DATA EDITOR: Meniul File Funcţii principale Observaţii Operaţii de deschidere şi salvare de fişiere Operaţii de Select/Copy/Cut/Paste. setează modul View de afişare: cu sau fără bara de butoane. Win 9X) În cazul ferestrei Data Editor.Meniurile SPSS Meniurile de tip listă se aseamănă cu meniurile altor programe sub Windows. prelucrarea datelor cu SPSS presupune următoarele etape: Opţiuni: (a) Introducerea directă a datelor în DATA EDITOR (b) Deschiderea unui fişier de date SPSS (extensia . Fără a intra în amănunte.5 în sus. iar de la versiunea 7. selectare. Importante pentru Data inserare. Transform pregătirea datelor în recodificare. Find şi. definire. adiţionare pregătirea datelor în de fişiere.SAV) (c) Importarea unui fişier de format diferit (se alege din caseta File open/File of type) 1 Introducerea datelor -6- . Funcţii de operare cu variabilele. cu sau fără liniile despărţitoare ale celulelor. o Help Informaţii de ajutor procedură de sprijin în alegerea tipului de prelucrare statistică (Statistic Coach) Paşii analizei statistice cu SPSS În principiu.

Se editează rezultatele afişate în Viewer. 7 8 Editarea rezultatelor Inserarea datelor întrun document  SPSS este un program puternic de analiză statistică a datelor. transformarea variabilelor prin calcule. nici alegerea procedurilor şi nici interpretarea rezultatelor nu va fi cu adevărat posibilă. recodificări. Utilizarea lui optimă presupune. aducându-le la forma dorită sub aspect grafic  Dublu clic pe un element din Viewer conduce la intrarea elementului respectiv în regim de editare) Rezultatele din SPSS Viewer se preiau cu Select/Copy şi se depun cu Paste în orice tip de editor de documente. declararea valorilor lipsă. în mod necesar. În lipsa acestora. Transform) Meniurile Statistics (sau Analyze) şi Graphs În conformitate cu configuraţia casetei de dialog care este afişată la fiecare procedura Se acţionează butonul OK din caseta de dialog a procedurii  Butonul devine activ numai atunci când sunt întrunite condiţiile presupuse de procedura respectivă Rezultatele prelucrărilor sunt afişate într-o fereastră specifică (SPSS Viewer). -7- . în funcţie de versiune. combinarea datelor din două fişiere diferite (meniurile Data. selecţii. stăpânirea de către operator a cunoştinţelor teoretice de statistică.  Aşa cum un program de editare grafică nu compensează lipsa de talent la desen. cu funcţiuni de editare grafică sau de tip text. nici SPSS nu poate fi cu adevărat exploatat de către cei care nu au cunoştinţe de statistică.2 3 4 5 6 Pregătirea datelor Selectarea procedurii satistice Selectarea variabilelor ce urmează a fi supuse prelucrării Rularea procedurii Analiza rezultatelor Corecţia erorilor.

fiecare din cele trei situaţii: a) Crearea unei baze de date SPSS În linii generale. o anumită unitate de informaţie. editarea variabilelor se face într-o fereastră specială. la intersecţia cărora se formează celulele care conţin. c) Importarea unei baze de date din alt format decât SPSS În continuare.  Existenţa unei baze de date deschisă în fereastra Data Editor este o condiţie obligatorie pentru operarea cu SPSS  SPSS operează numai cu o singură bază de date deschisă la un moment dat În principiu. Cu toate acestea.Editarea datelor O bază de date în SPSS este o structură formată din linii şi coloane. pentru crearea unei baze de date proprii în SPSS. existente pe un suport de memorie. elementele de bază rămân aceleaşi ca al versiunile anterioare.sav) Definirea variabilelor  se acţionează Define variable din meniul Data  soluţie mai directă este dublu clic pe capul de coloană  În versiunile de SPSS mai recente. vom trata pe rând. b) Deschiderea unei baze de date SPSS. -8- . se procedează astfel:  Se lansează SPSS  Se definesc variabilele bazei de date în domeniul Data Editor  Se introduc datele pentru fiecare caz (subiect) în parte  Se salvează baza de date (extensia specifică este *. fiecare. o bază de date SPSS se obţine pe una din următoarele căi: a) Crearea ei prin operaţiunea de definire a variabilelor şi introducerea datelor de la tastatură.

apare o casetă de dialog ca în imaginea de mai jos (forma ei nu diferă substanţial de la o versiune de SPSS la alta). Nominal Butoanele OK (pentru finalizarea definirii variabilei. Acesta se şterge. este o zona informativă în care sunt afişate caracteristicile predefinite ale noii variabile. maxim 8 caractere. Cele mai importante aspecte legate de denumirea variabilelor sunt următoarele:  Trebuie sa fie format din minim 1. se permite declararea tipului de măsurare specific variabilei: Scale (Interval/Raport). Change Settings. Numele variabilei: Orice variabilă SPSS trebuie să aibă un nume. pentru a fi înlocuit cu numele pe care dorim să îl dăm variabilei.  Nu sunt suportate caractere „speciale” cum ar fi spaţiu sau semne de punctuaţie -9- . Dacă privim caseta. Aceste caracteristici se pot seta în Edit-Options (sau Preferences. VAR00001 este numele implicit al primei variabile. Ordinal. Variable Description. Help (informaţii legate de definirea variabilelor)  În versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de casetă. vom observa următoarele elemente: • • • • • Variable Name: zona de declarare a numelui de variabilă. dar toatele elementele ei constitutive se regăsesc.Ca urmare a operaţiei de mai sus. la unele versiuni). este o zonă care cuprinde butoane de comenzi pentru modificarea setărilor implicite: În zona Measurement. Cancel (pentru renunţarea la definirea variabilei.

. însă.a. TR_02.d. SPSS poate opera cu o varietate de tipuri de variabile. Respectarea anumitor convenţii poate fi. TR_2. De exemplu. În cazul utilizării unor caractere improprii. mai ales dacă avem de a face cu o baza de date cu multe variabile. deoarece ulterior SPSS aranjează alfabetic variabilele în listele de selecţie şi. Dacă într-o situaţie de acest gen am avea 10 sau mai multe „momente”.  Într-o bază de date nu pot exista două variabile cu acelaşi nume!  Există o serie de cuvinte „rezervate”. TO. EQ. este de preferat să se declare nume de genul TR_01. NE.m. AND. Cele mai uzuale sunt tipurile: . Acestea sunt: ALL.. unde se marchează tipul variabilei şi se declară caracteristicile acesteia (Width.TR_10.. LT. Iată câteva recomandări utile în acest sens (ele nu sunt obligatorii): • Numele să exprime. se va utiliza o schemă de denumire care să exprime acest lucru. Fiecărui tip îi corespund anumite proprietăţi (caracteristici) care trebuie definite de operator. astfel. pentru a se reveni la caseta Define Variable. OR. extrem de utilă. în cazul variabilelor numerice) • Se acţionează butonul Continue. • caracterul underscore este recomandabil ca separator în cadrul numelui de variabilă). BY. putem declara variabilele TR_1.. LE. conţinutul variabilei • Pentru variabile „înrudite”. WITH. se păstrează ordinea dorită. NOT. etc. GE.10 - . TR_3 ş. Aşa cum se observă în caseta Define Variable Type din imaginea de mai sus. dacă avem variabile care cuprind valori ale timpului de reacţie măsurat în mai multe condiţii. GT. pe cât posibil.. Definirea „tipului” de variabilă Tipul de variabilă se referă la • Se acţionează butonul Type de pe caseta Define Variable • Apare caseta Define Variable Type • .  Alegerea numelui este la latitudinea operatorului. Decimal Places. THRU. a căror utilizare ca nume de variabile nu este acceptată de program. apare un mesaj de eroare şi se permite corectarea numelui.

Există o mare varietate de formate pentru acest tip de variabilă. introduse cu valori numerice. aşa cum se vede în imagine.  SPSS face distincţie între variabile de tip caracter „scurte” (Short string) şi „lungi” (Long string). [Caracter] (String). care cuprind valori exprimate sub formă de caractere alfanumerice (litere sau chiar cifre). care cuprind valori de tip numeric cu sau fără zecimale. acoperind.  Deşi permisă. Unităţi de timp calendaristic sau orar [Date]. Proprietăţi • formatul de întroducere. Toate variabilele care suportă codificări vor fi. Primele au maxim 8 caractere şi pot fi incluse în unele proceduri statistice (semnificaţia diferenţei între medii. utilizarea variabilelor „string” nu este de preferat. de preferinţă.[Numeric]. .11 - . Pentru o variabilă în care vom introduce rezultatul la un test exprimat în scoruri T cu o zecimală. orice cerinţă posibilă din partea utilizatorului. dar poate fi modificat după dorinţă. care poate fi unul din cele evidenţiate în caseta Define Variable Type/Date Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul „21-FEB2001” (luna fiind scrisă obligatoriu după prescurtarea ei în engleză). practic. Proprietăţi: • numărul de cifre necesare pentru exprimarea „întregilor” • numărul de „zecimale” EXEMPLE: Pentru o variabilă în care vom introduce vârsta în ani împliniţi. Proprietăţi • numărul de caractere rezervat.). de exemplu). Utilizarea acestora în proceduri statistice nu este limitată de nici o restricţie. pe când celelalte nu pot fi utilizate decât în operaţii de listare (cazul variabilei de genul „nume”. vom defini Type Numeric cu Width 2 (presupunând că nu avem subiecţi cu vârsta peste 100 de ani) şi Decimal Places 0. care pot include valori de timp într-un format specificat. definim Type Numeric cu Width 2 şi Decimal Places 1. care este fixat implicit la 8. de ex.

Imaginea prezintă etichetarea valorilor unei variabile care se referă la calificativul la un examen. 255).  Etichetele pentru valori vor fi introduse una câte una. în cazul variabilelor de tip nominal sau ordinal. dar facem precizarea că semnificaţia lor poate fi găsită în Help-ul casetei Define Variable Type.  Opţiunile din zona Measurement (Scale. nu au întotdeauna o utilitate practică dar marcarea lor corectă este necesară pentru anumite proceduri statistice sau grafice.  Eticheta variabilei nu se supune restricţiilor pentru nume.  Tipul unei variabile poate fi schimbat ulterior prin simpla redefinire a acesteia. Variabilele de tip Date beneficiază de funcţii speciale de tratare şi analiză în SPSS. care conţine spaţii pentru eticheta variabilei (Variable Label) şi pentru etichetele valorilor (Value labels). putând conţine oricâte caractere (max. Se deschide o nouă casetă (Define Labels). Ordinal. Se observă că valoarea 1 are eticheta SLAB. Nu vom prezenta şi celelalte tipuri de variabile. Se va acorda atenţie mesajelor care pot să apară şi care avertizează asupra eventualelor pierderi de informaţie prin schimbarea tipului. care se regăsesc doar la versiuni SPSS de la 7. eticheta BUN (încă nu a fost acţionat butonul Add pentru a fi finalizată declaraţia etichetei acestei valori). Nominal). Etichetarea se poate practica atât la nivelul variabilei dar şi la valorile pe care le conţine. dar şi spaţii sau alte semne grafice tipăribile. ele fiind mai puţin folosite. eticheta MEDIU iar valoarea 3. valoarea 2. astfel:  se plasează valorea etichetatăîn zona Value  se introduce eticheta corespunzătoare în zona Value label  se acţionează butonul Add  Operaţiunea se reia pentru toate valorile pe care dorim să le etichetăm.0 în sus.12 - . Etichetarea variabilelor şi a valorilor Etichetarea este o formă de descriere explicită a conţinutului variabilei (având în vederea că numele variabilei nu poate fi mai mare de 8 caractere). Pentru etichetare se apasă butonul Labels de pe caseta Define Variable. .

etichetele sunt asociate prelucrărilor grafice (histograme. a căror menţinere în anumite prelucrări poate determina modifcări semnificative a rezultatelor.  valori lipsă declarate de utilizator (user missing values) adică valori pe care utilizatorul le declară ca atare. din diverse motive. declararea variabilelor se compune din următoarele operaţiuni: . Atenţie. Să ne gândim numai la valorile extreme ale unei distribuţii. Acestea pot exista în baza de date dar utilizatorul. Deşi nimic nu ne obligă să aplicăm etichete variabilelor şi valorilor. bare.  Oricum.) fapt care reduce necesitatea de a le introduce ulterior prin editarea respectivelor grafice. aceste valori nu sunt şterse şi nici nu sunt marcate în mod evident pe ecran. ele vor putea fi modificate ulterior sau editate direct în SPSS Viewer.  Pentru a şti cum să declarăm etichetele. etc. Foarte adesea suntem nevoiţi să scoatem din prelucrări anumite valori (care nu pot fi totuşi. În plus. este foarte recomandabil ca ele să fie atribuite. Forma lor de evidenţiere pe ecran este un punct plasat în celula respectivă. utilitatea funcţiei de declarare a valorilor lipsă nu trebuie subestimată. pur şi simplu. nu doreşte să fie luate în calcul. atunci au fost bine definite.  Etichetele ajută la citirea mai uşoară a rezultatelor (deoarece apar alături de acestea).13 - . este bine să ni le imaginăm ca fiind înscrise pe axele de referinţă ale unui grafic. odată declarate. şterse). Dacă „se potrivesc”. Se observă că există mai multe opţiuni:  declararea a trei valori distincte ca fiind lipsă (Discrete missing values)  declarea unui domeniu de valori lipsă (Range of missing values)  declararea unui domeniu la care se poate adăuga şi o valoare distinctă (Range plus one discrete missing value)  Deşi nu pare foarte evidentă acum. Declararea valorilor lipsă (missing values) Valorile lipsă sunt de două tipuri:  valori lipsă de sistem (system missing values) adică valori care lipsesc din baza de date (nu au fost introduse). În concluzie. care generează apariţia casetei de dialog alăturate. Pentru declararea valorilor lipsă se acţionează butonul Missing Values din caseta Define Variables.

caracter. prin selectarea acestora (clic pe capul de linie) şi tasta Delete (sau Edit-Cut). data) Atribuirea etichetei variabilei Atribuirea etichetei valorilor.  Inserarea unei variabile se face prin plasarea cursorului-celulă pe coloana variabilei în stânga căreia dorim să inserăm noua variabilă (sau prin selectarea variabilei respective). . Explicaţie: Introducerea inutilă a unei valori într-o variabilă. în cazul variabilelor măsurate pe scale nominale sau ordinale  Declararea valorilor lipsă (care nu au fost recoltate în procesul de măsurare. se defineşte variabila inserată (nume. Erori frecvente . există soluţia închiderii bazei de date. Din acest motiv. clic dreapta pe capul de coloană sau de linie. fişierul rămânând nemodificat. după care se acţionează în meniul Data-Insert case. După aceasta. Ştergerea şi inserarea cazurilor  Ştergerea cazurilor se face în mod similar variabilelor. pentru că datele pot fi definitiv pierdute.14 - .  Inserarea cazurilor se face după plasarea cursorului pe linia deasupra căreia dorim să inserăm un nou caz. din diferite motive)     Ştergerea şi inserarea variabilelor  Ştergerea unei variabile se face prin selectarea acesteia (clic pe capul de variabilă) şi acţionarea tastei Delete (sau se comandă din meniul Edit-Cut). fără a se accepta salvarea cerută de program.  SPSS nu permite Undo (în meniul Edit) decât limitat la ultima acţiune. Cu toate acestea.Apariţia unor cazuri inutile. după care se comandă. pe care l-a umplut cu system missing values. din meniul Data-Insert variable. totuşi. SPSS a creat deja un caz nou. Se va reţine.  Pentru versiunile de SPSS de la 7 în sus.  În cazul unei acţiuni care produce efecte nedorite asupra bazei de date. că baza de date se actualizează pe hard disk numai după salvarea comandată de utilizator. (umplute cu system missing values) la sfârşitul unei baze de date.Atribuirea numelui (maxim 8 caractere) Definirea tipului (numeric. etichete). tip.. produce un meniu contextual care permite un acces mai rapid la funcţiile de inserare/ştergere. Soluţie: Selectarea cazului prin apăsarea pe capul de linie şi acţionarea tastei Delete (sau Edit-Cut). Se pot selecta mai multe cazuri simultan (drag cu mouse-ul pe capul liniilor) după care se şterg ca mai sus.  Orice modificare efectuată nu produce efecte decât asupra datelor din memoria de lucru. valoare care apoi este ştearsă. după care se deschide fişierul respectiv din nou.. ştergerea variabilelor sau a cazurilor trebuie să se facă cu atenţie. Ca urmare.

Identitate Nu se aplică subiecţielor pentru un cod Decimal Places 0 etichete (esentiala pentru numeric dacă (presupunem că nu decât la a asigura nu avem avem mai mult de 99 valorile identitatea nevoie de subiecţi) variabilelor fiecarei numele de tip inregistrari subiecţilor) categorial inparte si pentru (nominale realizarea sau corespondentelor ordinale) cu alte baze de date in care avem informatii cu privire la aceiaşi subiecţi) Sexul SEX Numeric. Pentru analiza datelor suntem interesaţi să raprtăm rezultatele la o serie de caracteristic demografice ale subiecţilor. să zicem: sexul şi vârsta. Variabila Numele Tipul variabilei Eticheta Etichetele variabilei variabilei valorilor Identitatea COD (optăm numeric. SPSS creează automat o variabilă implicită.Apariţia unor variabile inutile (nedorite). Pentru fiecare dintre informaţiile pe care dorim să le introducem în baza de date vom crea câte o variabilă. sau în Decimal Places 0 luni dacă dorim (presupunem că nu mai multă avem subeicţi cu precizie) vârsta peste 99 de ani) Extraversiune EXTRAV Numeric. Explicaţie: La introducerea din greşeală a unei valori într-o variabilă nedefinită în prealabil. Sex 1=feminin Decimal Places 0 2=masculin Vârsta (în ani VIRSTA Numeric. pentru a avea controlul datelor dorim să inregistrăm şi identitatea subiecţilor. Nevrozism . - Exemplu practic de realizare a unei baze de date Să ne imaginăm că am aplicat testul Eysenck Personality Inventory. Extraversiune Decimal Places 0 (nu se poate obţine o valoare mai mare de 100 şi nu există zecimale) Nevrozism NEVRO Numeric. În plus. Vârsta împliniţi. pe care o denumeşte VAR00001. Width 1. Width 2. Width 2. Soluţie: Se selectează variabilă resectivă (clic de mouse pe capul de coloană) şi se acţionează tasta Delete (sau Edit-Cut).15 - . care vizează următoarele caracteristici de personalitate: extraversiunea. nevrozismul şi atitudinea defensivă (scala Lie). Width 2. Width 2.

de tip numeric (cu valorile convenţionale 1 şi. VÂRSTA) se poate utiliza fără nici un inconvenient numele şi ca etichetă. poate fi declarată de tip caracter (cu valorile M si F) dar. pentru explicitarea valorilor se vor folosi etichetele de valoare (value label). scutind un mare volum de muncă pe care l-ar implica introducerea numelor. identificarea numerică a fiecărei înregistrări este suficientă (şi absolut necesară).Lie LIE Decimal Places 0 (nu se poate obţine o valoare mai mare de 100 şi nu există zecimale) Numeric. Width 1. În acest din urma caz. Decimal Places 0 (nu se poate obţine o valoare mai mare de 9 şi nu există zecimale) „Minciună” Se observă faptul că pentru variabile ale căror nume exprimă exact conţinutul (SEX.  Introducerea unei variabile care să conţină numele subiecţilor poate fi necesară doar dacă ne propunem realizarea unor liste ale subiecţilor din baza de date. De exemplu. Deşi el poate opera şi cu date de tip caracter. la fel de bine. cu precădere.16 - . imaginea DATA EDITOR pentru primii trei subiecţi introduşi cu variabilele de mai sus:  Insistăm pe declararea. ca pe documentul original să scriem codul . Pentru a nu avea surprize. este recomandabil să fie utilizate variabile de tip numeric în toate cazurile. Pentru a fi mai expliciţi. fapt care implică date numerice. să spunem că numele variablei este util în primul rând SPSS-ului pentru a manipula variabilele. 2). în timp ce etichetele sunt necesare mai ales utilizatorului pentru a înţelege cu uşurinţă la ce se referă o variabilă al cărui nume prea scurt Avem alăturat. Vom avea grijă însă. Altfel. respectiv. acestea nu sunt acceptate pentru toate tipurile de proceduri statistice. a variabilelor de tip numeric: SPSS este un program de prelucrare statistică. variabila sex.

vom avea variabila „SPORT” care poate primi două valori. Într-un asemenea caz ne putem aştepta să avem mai multe răspunsuri la aceeaşi întrebare.)  Variabile multiple pentru întrebări cu răspuns multiplu: De obicei. Soluţia pentru introducerea datelor este.”. o întrebare prezintă un singur răspuns. crearea mai multor variabile. la nevoie. atunci nu este necesar să declarăm o variabilă pentru „corecte” şi una pentru „greşite” dacă suma lor dă totalul răspunsurilor. şi aşa mai departe.  Evitarea variabilelor redundante: Dacă la un test nu sunt posibile. indiferent ce modificări facem în Data Editor pe ecran.sav)  Se acţionează Save  SPSS poate salva şi în alte formate. de aceea. Salvarea în aceste formate poate fi utilă pentru transferul datelor pentru prelucrări ulterioare în alte programe. decât răspunsuri corecte sau greşite. Salvarea bazei de date din Data Editor O bază de date aflată în lucru nu are un corespondent într-un fişier decât după ce se execută o salvare a acesteia. sa zicem „1” dacă este aleasă şi „0” dacă nu este aleasă. salvarea se face în mod similar cu orice alt program cunoscut: File-Save as. de exemplu..17 - . sport. 3. Acest lucru nu trebuie niciodată uitat. de ex. Pentru o bază de date nou creată. SPSS nu are o funcţie de salvare automată după un interval de timp prestabilit. Excel. Astfel. În acest mod vom putea analiza frecvenţa alegerilor pentru fiecare variantă de răspuns în parte. Lotus 1-2-3.numeric aferent fiecărui subiect. care deschide următoarea casetă de dialog:  Se alege locaţia de salvare (Save in)  Se dă un nume fişierului (File name)  Se verifică tipul de fişier (formatul implicit pentru baze de date SPSS are extensia . . să se poată identifica numele (pentru corecţii. petreceri cu prieteni. filme. Spre deosebire de WORD de exemplu. datele respective vor fi salvate numai la comanda explicită a operatorului. etc. astfel încât. 2. Cu alte cuvinte. dintre cele mai importante fiind: Dbase sau FoxPro. dar pot fi situaţii în care o întrebare prezintă răspunsuri multiple care pot fi alese în acelaşi timp. De exemplu: „Ce activităţi preferaţi pentru timpul liber? 1. câte una pentru fiecare variantă de răspuns..

putem încerca transformarea lor prealabilă din formatul original într-un format recunoscut de SPSS. se va alege tipul respectiv din lista Files of type.sav)  Se acţionează Open  În cazul deschiderii unui fişier de alt tip decât SPSS. .Deschiderea unei baze de date SPSS O bază de date creată cu SPSS se deschide cu comanda File-Open. În cazul în care SPSS nu recunoaşte tipul de fişier în care se află datele noastre.18 - . Deşi există riscul pierderii unor aspecte ce ţin de formatul de reprezentare a datelor. care activează următoarea casetă de dialog:  Se alege locaţia de citire (Look in)  Se indică fişierul dorit (selectarea cu mouse-ul) în fereastra de căutare  Se indică tipul de fişier ce urmează a fi deschis (implicit este de tip SPSS cu extensia . operaţiunea scuteşte totuşi un mare volum de muncă.

Se poate observa că unii dintre subiecţi nu au valori la toate cele trei scoruri (valori lipsă de sistem). scor_2 si scor_3). În continuare. • Avem un număr de variabile „primare” în care se află rezultatul parţial pentru fiecare minut din cele 10 câte durează un test de calcul aritmetic şi dorim să creăm o nouă variabilă ( „secundară”) în care să avem media performanţei pe cele 10 minute sau abaterea standard a performanţei pe cele 10 minute. Imaginea de mai jos prezintă o tabelă de date SPSS care cuprinde scorurile la trei examene parţiale (scor_1. pentru fiecare subiect. • Dorim să transformăm variabila care conţine vârsta. de la tastatură. c) variabile „secundare” rezultate prin transformările aplicate variabilelor primare. Exemple de situaţii în care se impune transformarea variabilelor: • Avem mai multe variabile „primare” care conţin răspunsurile la întrebările unei scale de tip Lickert şi suntem interesaţi să calculăm (într-o variabilă „secundară”) suma răspunsurilor. SPSS oferă proceduri de transformare în meniul Transform. de regulă. care sunt unele dintre cele mai des întâlnite. Însumarea valorilor variabilelor Se utilizează atunci când dorim să obţinem o variabilă prin adunarea valorilor din două sau mai multe variabile.Operaţii de transformare a variabilelor Dacă privim variabilele SPSS din punctul de vedere al modului în care au fost create. dar şi pentru multe altele încă. într-o altă variabilă care conţine valori pentru categorii de vârstă. care să conţină vârsta. . vom prezenta câteva dintre cele mai frecvent utilizate funcţii de transformare a variabilelor. prin însumarea celor trei variabile. Pentru toate aceste situaţii. • Avem o variabilă care conţine data naşterii şi dorim să creăm pe baza ei o altă variabilă. Dorim să realizăm o variabilă care să cuprindă un scor general.19 - . putem distinge două categorii: b) variabile „primare” care includ valori rezultate direct din cercetare si au fost introduse.

Se scrie expresia de însumare în zona Numeric Expression. o nouă variabilă este plasată după toate variabilele existente. cu virgulă între ele.Deoarece prin calculare. 2.. am preferat să inserăm o nouă variabilă imediat după cele trei pe care dorim să le însumăm. variabilele numerice se vor scrie între paranteze. sintaxa fiecărei funcţii trebuie respectată întocmai. Atenţie. expresie numerică. una câte una.).. Se introduce numele noii variabile în zona Target Variable („total”). aşa cum se vede şi în zona listei Functions: Ea poate fi scrisă de la tastatură sau selectată din lista de funcţii şi „ridicată” prin acţionarea butonului ▲. În acest fel avem şi posibilitatea să controlăm uşor corectitudinea operaţiei de însumare Se apelează procedura Transform-Compute. În cazul nostru. .20 - . Funcţia este SUM (expresie numerică. . Variabilele pot fi scrise de la tastatură sau mutate la rândul lor din lista de variabile cu butonul ►. care deschide caseta de mai jos: Se efectuează următoarea succesiune de operaţii: 1.

.. . În acest caz.. expresie_numerică. deoarece ştim că am creat această variabilă tocmai pentru a depune în ea suma. clauza TO va fi cuprinsă între spaţii.. SPSS ne întreabă dacă dorim să modificăm conţinutul acesteia. ne-ar interesa media valorilor de la mai multe variabile. cu condiţia ca variabilele pentru care se realizează media să se afle una după alta în tabela SPSS. Rezultatul operaţiei se vede în imaginea de mai jos: Calcularea mediei a două sau mai multe variabile Presupunând că în loc de sumă. se procedează în mod similar. Răspundem OK. Deoarece variabila total există. atunci avem posibilitatea să scriem o expresie de însumare simplificată. Ca şi în cazul sumei. unde . astfel SUM (prima_variabilă TO ultima_variabilă). cu virgulă între ele. Expresia de calcul a mediei este MEAN (expresie_numerică. 3.Dacă variabilele ce vor fi însumate se află în baza de date una după alta. Se apasă butonul OK 4. Această opţiune ne sugerează cât de important poate fi să aranjăm corespunzător variabilele în structura unei tabele SPSS.21 - . se poate realiza o expresie cu clauza TO. rezultatul operaţiei de calcul ar fi depus într-o variabilă creată automat şi amplasată după ultima variabilă din baza de date. arată că putem pune oricâte variabile (sau valori) numerice. ca în cazul exemplului nostru. pentru a nu fi confundată cu un nume de variabilă.. Dacă nu ar exista o variabilă cu acest nume.).

vom exemplifica cu realizarea unei variabile care să conţină anul naşterii. prin selectare şi acţionarea butonului ▲. 2000) şi anul naşterii: Pentru . Imaginea de mai jos este extrasă din baza de date Employee data. utilizându-se marea varietate de funcţii care se găsesc în lista Functions şi a căror semnificaţie se poate află din Help-ul casetei Compute.sav Observăm că variabila bdate.Reamintim că funcţia MEAN poate fi scrisă de la tastatură sau poate fi adusă din lista de funcţii.22 - . Este de la sine înţeles că expresia de calcul poate fi realizată şi într-o manieră simplă şi directă. Extragerea anului dintr-o variabilă de tip cronologic (date) SPSS oferă funcţii de transformare cu variabilele de tip cronologic. astfel: Pentru sumă: scor_1+scor_2+scor_3 Pentru medie: (scor_1+scor_2+scor_3)/3  Se va face o distincţie clară între suma sau media astfel obţinute. pe întreaga distribuţie  Se pot realiza diverse alte funcţii de transformare. care conţine data naşterii. trebuie să calculăm diferenţa dintre anul curent (să zicem. Pentru a avea vârsta. să zicem. la nivelul fiecărei variabile în parte. Dintre acestea. pentru acelaşi subiect. fără utilizarea funcţiilor (SUM sau MEAN). care se referă la suma sau media valorilor de la mai multe variabile. scos dintr-o variabilă care conţine data naşterii. şi suma sau media pe care am calcula-o pe verticală.

însă.YEAR(). Această funcţie are ca rezultat extragerea valorii care reprezintă anul dintr-o variabilă de tip dată calendaristică. În toate cazurile. În zona Numeric Expression vom scrie expresia de transformare. care se bazează pe funcţia XDATE.Desigur. putem scrie expresia astfel: 2000-XDATE. prin efectuarea unei noi transformări realizarea diferenţei dintre anul curent şi anul naşterii. de tip numeric. care se află în câmpul bdate. vom insera o variabilă (denumind-o „virsta”. apoi. Am preferat o soluţie într-o „singură etapă” pentru că este mai operativă. valorile rezultate prin transformare (corespunzătoare anului 2000). XDATE. În cazul nostru. Pentru a avea variabila ce urmează a fi creată în apropierea variabilei bdate. nu se va alege soluţia modificării valorilor dintr-o .YEAR(bdate)=anul naşterii Ca urmare. Mai întâi prin extragerea anului naşterii într-o variabilă separată şi.  Posibilităţile de transformare a variabilelor oferite de SPSS permit crearea unor noi variabile pe baza celor existente. transformarea putea fi efectuată şi în două etape.aceasta trebuie să facem diferenţa dintre anul curent (2000) şi anul naşterii. cu doi întregi).23 - . Apoi utilizăm procedura Compute din meniul Transform: În câmpul Target variable introducem numele noii variabile (virsta).YEAR(bdate) Mai jos putem vedea rezultatul procedurii Compute: Se observă în variabilă virsta. în funcţie de necesităţile de prelucrare pe care le avem.

Cu alte cuvinte. în cazul unei distribuţii de vârstă exprimată în ani.Into Defferent Variables din meniul Transform: Atenţie. Procesul este similar cu crearea unei tabele de frecvenţe grupate şi ne reamintim că poate fi derulat în maniera descrisă mai jos: Paşi pentru grupării de frecvenţe: • Se face diferenţa dintre valoarea cea mai mare şi valoarea cea mai mică a unei distribuţii • Se împarte valoarea obţinută la mărimea posibilă (estimată) a intervalului • Se selectează mărimea intervalului care conduce la un număr de clase cuprins între 5 şi 15 • Se determină limita inferioară a primului interval (trebuie să fie un multiplu al mărimii intervalului) • Se determină limita superioară a primului interval • Se construiesc intervalele de clasă pentru fiecare interval. se poate opta pentru un număr de clase care serveşte cel mai bine interesul de cercetare. nu mai avem la dispoziţie variabila iniţială pentru o nouă recodificare. este preferabil să se opteze pentru clase „cincinale” sau „decade”. în caz de necesitate. de aceea ar fi foarte utilă obţinerea unei variabile care să asocieze anumite valori convenţionale pentru categorii de virsta. De exemplu. astfel: Se lansează procedura Recode . În urma transformării de mai sus. deşi este recomandabilă obţinerea unei grupări de frecvenţe pe 5-15 clase.24 - . acestea având şi o anumită semnificaţie „psihologică”. am obţinut variabila virsta. şi nu să modificăm valorile existente din variabilele „primare” a căror pierdere ar necesita reintroducerea lor. Recodificarea variabilelor Recodificarea unei variabile înseamnă convertirea valorilor acesteia. se poate alege şi opţiune Into Same Variables. fiind atenţi să avem clase „suprapuse” sau „intervale neacoperite” În principiu. este recomandabil să creăm prin transformare variabile noi. .variabilă „primară” peste valorile deja existente. Utilizarea ei ca atare în analize statistice este improprie. Pentru aceasta putem efectua „recodificarea” variabilei virsta pentru a obţine o distribuţie grupată de frecvenţe. cu scopul obţinerii unei distribuţii bazată pe frecvenţe cumulate. în cazul unei erori. dar nu este recomandabilă deoarece.

Paşi de efectuat la apariţia casetei Recode into Defferent Variable: • se trece variabila virsta în zona Numeric Variable → Output Variable. Semnul întrebării arată că se aşteaptă numele variabilei ce urmează să fie creată prin recodificare. • Acest nume se scrie în zona: Name, după care se apasă butonul Change. Am ales, absolut convenţional, ca nume al variabilei recodificate, v_clase. Urmează acum să descriem limitele claselor de recodificare. Pentru aceasta, se acţionează butonul Old and New Values

Deşi relativ complicată, caseta de declarare a noilor valori în funcţie de cele vechi este uşor de înţeles.

În zona Old value, se alege una dintre variantele de definire a valorilor de la care se pleacă. Să zicem că am ales soluţia să recodificăm anii pe intervale de zece ani, primul interval fiind 29-39, al doilea 40-49, ş.a.m.d. Pentru aceasta activăm opţiunea Range şi scriem valorile limite al intervalului dorit. După aceasta, în zona New value oValue, scriem care este valoarea pe care o asignăm acestei clase. În fine, acţionăm butonul Add pentru a definitiva operaţiunea şi trecem la definirea următoarei clase, până terminăm. În zona Old→New se poate observa lista recodificărilor definite. Se acţionează butonul Continue şi, la revenirea în caseta anterioară, butonul OK. Rezultatul operaţiuni se vede mai jos:

- 25 -

Se observă corespondenţa dintre valoarea din variabila virsta, cu valoarea din variabila v_clase. Pentru valoarea 71, avem missing value în variabila v_clase, deoarece nu am definit un interval care să cuprindă această vârstă. (De regulă, această situaţie este determinată de o eroare de definire a intervalelor de clasă. Pentru a o repara, ar trebui să intrăm din nou în procedura Recode şi să redefinim clasele).
relua.

Transformarea operată pe variabila vîrstă nu este de loc inutilă. Dacă am fi dorit să vedem în ce măsură este o relaţie între nivelul salariului şi vârstă, ar fi fost oarecum impropriu (fără a fi propriu-zis o greşeală ) să utilizăm o statistică parametrică (corelaţia). În analizele statistice pe vârste este recomandabil, totuşi, să operăm cu grupe de vârstă. Ordonarea după rang a valorilor unei variabile Aşa cum am spus în cuprinsul primei părţi a acestui volum, este posibil să ne confruntăm cu o variabilă cantitativă ale cărei valori nu respectă condiţiile unei statistici parametrice (vezi figura din stânga, unde valoarea 250 este excesivă). Într-o situaţie de acest gen, una din soluţiile posibile este transformarea de rang, cu procedura TransformRank cases (caseta din dreapta):

- 26 -

Variabila vizată (scor) este trecută în lista Variable(s), se setează modul de ordonare (am ales atribuirea rangului 1 valorii celei mai mari) iar apoi am acţionat butonul OK. Procedura permite fixarea unor parametri de transformare cu ajutorul butoanelor Rank şi Ties, asupra cărora nu insistăm aici.

Organizarea datelor pentru analiză
SPSS permite efectuarea unor operaţii de organizare a datelor care prezintă un interes aparte pentru faza de analiză. Acestea sunt: sortarea, împărţirea fişierului în subgrupuri, selectarea unor seturi de date, combinarea fisierelor (adăugarea de cazuri, adăugarea de variabile). Le vom trece în revistă, pe rând. Sortarea bazei de date Sortarea este operaţia de aranjare a bazei de date în funcţie de ordinea crescătoare/descrescătoare a valorilor unei variabile. Ea este utilă mai ales pentru inspectarea directă a valorilor de la extrema unei distribuţii sau pentru listarea ordonată a bazei de date. Procedura utilizată este: Data-Sort. Baza de date nesortată Caseta Sort Cases

Imaginea din casetă descrie sortarea bazei de date, crescător (Ascending), după valorile variabilei scor (rezultatul se vede în imaginea de mai jos).

Se poate efectua sortarea simultană după mai multe variabile, fiecare în sensul dorit, de exemplu: grup(Ascending) şi scor(Descending). - 27 -

Împărţirea bazei de date în subgrupuri Baza de date SPSS poate fi împărţită în subgrupuri, pentru analiză distinctă. Atunci când datele sunt astfel organizate, orice procedură de analiză se va efectua distinct pentru fiecare subgrup. Procedura este: Data-Split File iar caseta de dialog este cea de mai jos:

• • •

Opţiunile sunt: Analyze all cases, do not create groups (pentru analiza integrală a datelor) Compare groups (rezultatele vor fi afişate astfel încât să poată fi uşor comparate) Organize output by groups (rezultatele vor fi afişate în Viewer, separat pe grupuri)

 Operaţia nu produce nici o modificare vizibilă asupra bazei de date. Singurul efect se vede în zona de afişare a rezultatelor, unde toate procedurile de analiză vor fi afişate pentru fiecare subgrup în parte.  Pentru a se reveni la analiza intergrală a datelor, se va reveni în procedura Split File şi se va seta opţiunea Analyze all cases.... Selectarea unor seturi de date Selectarea unui set de date permite aplicarea procedurilor de analiză numai pe cazurile selectate. Dacă nu se optează pentru ştergerea datelor neselectate, ele vor fi păstrate şi vor putea fi reintroduse în analiză. Procedura este Data-Select Cases.... Pentru exemplificare, să ne propunem selectarea din baza de date din imaginea de mai sus a cazurilor aparţinând grupului 1. Imaginea prezintă: • În partea stângă, baza de date • La mijloc, caseta principală Select Cases care are: o Zona listei de variabile o Zona fixare a condiţiilor de selectare Select, unde:

- 28 -

dar sunt permise selecţii bazate pe funcţii mai complicate sau care pot să includă combinaţii de variabile. care deschide caseta Select Cases: if. permite opţiunea de filtrare a cazurilor neselctate (Filtered) sau de eliminare a lor (Deleted). În cazul nostru. am trecut variabila grup în zona de editare a functie şi am declarat-o egală cu 1. baza de date se prezintă în felul următor: . celelalte fiind ignorate. toate cazurile din baza de date care au grup=1 vor fi analizate. Use filter variable. Astfel.29 - . selectează pe baza valorile unei variabile filtru Unselected cases Are. se bifează atunci când se doreşte declararea unei condiţii de selectare bazată pe o funcţie  IF este butonul de deschidere a casetei pentru declararea condiţiei. dar baza de date. Random sample of cases.o o o o All cases este setarea implicită şi înseamnă că toate datele intră în analiză  If condition is satisfied. dar actualizarea fişierului de pe hard disk se va face numai după prima comanda Save. permite selectarea unui set aleator de cayuri din baya de date Based on time por case range. În acest din urmaă caz. permite selectarea cazurilor în funcţie de poziţia din baza de date. Exemplul se bazează pe o selecţie simplă. cazurile neselectate vor fi şterse.  După finalizarea operaţiei de selectare de mai sus.

Efectul este obţinerea unor rezultate pe date parţiale. ne vom mulţumi să le prezentăm sumar: • Agregarea cazurilor. ca variabilă independentă (caz în care se va anula situaţia de selectare. Această variabilă poate fi ulterior utilizată în procedurile de analiză. Adesea se uită anularea unei selectări existente. atunci când există înregistrări multiple pentru fiecare subiect şi se doreşte păstrarea uneia singure (Data-Agregate) • Adăugarea unor cazuri din altă bază de date SPSS (Data-Merge Files-Add cases.30 - ....) • Adăugarea unor variabile din altă bază de date SPSS (Data-Merge Files-Add variables.  Selectarea este utilizată în mod obişnuit. Alte operaţii de organizare a datelor pentru analiză Opţiunile SPSS pentru organizarea datelor sunt mult mai numeroase decât cele descrise mai sus...) • Inversarea liniilor cu coloanele (Data-Transpose. atunci când se doreşte revenirea al analiza tuturor cazurilor..• • Se observă: Marcarea cu o diagonală a capului de linie corespunzător cazurilor neselectate Apariţia unei variabile de sistem filter_$ care conţine valoarea 0 pentru cazurile neselectate şi valoarea 1 pentru cazurile selectate.) . Fără a le trata în amănunt. prin bifarea opţiunii All cases). pentru alegerea temporară a unui set de date.

pe cale: o numerică (analiza de frecvenţe) o grafică (bară.  Aceste proceduri oferă prelucrări distincte dar conţin şi rezultate comune. pe de o parte. pentru versiunile mai noi de SPSS) şi sunt grupate în trei proceduri: Frequencies. În ceea ce priveşte procedurile specializate. Fie şi acest aspect numai. variabila pe care dorim să o supunem analizei va fi trecută în lista de calcul Variable(s). ele se lansează din meniul StatisticsSummarize (sau Analyze-Descriptive statistics. box-plot. Procedura Frequencies Este singura care permite analiza de frecvenţe.Calcularea indicatorilor statistici descriptivi Reamintim faptul că statistica descriptivă are ca obiectiv analiza caracteristicilor variabilelor. proceduri specializate şi. Principalele elemente de statistică descriptivă sunt: • reprezentarea întregii distribuţii. histogramă. Descriptives şi Explore.31 - . La apariţia casetei Frequencies. în ciuda caracterului ei „elementar”. stem and leaf) • valorile tendinţei centrale o mod o medie o mediană • valorile împrăştierii o amplitudine o abatere standard • valorile formei distribuţiei o indice de simetrie (skewness) o indice de boltire (kurtosis) SPSS oferă posibilităţi variate de reprezentare şi de calcul a acestor indicatori. prin selectarea ei şi acţionarea butonului de transfer . opţiuni care pot fi accesate din interiorul altor proceduri. În acest sens există. pe de altă parte. Alegerea uneia sau alteia dintre ele depinde de necesităţile de analiză. ar trebui să sugereze că analiza statistică descriptivă. este o componentă indispensabilă a analizei statistice.

astfel: Butonul Statistics Butonul Chart Butonul Format Se aleg indicatorii statistici Se alege tipul de Se aleg diverse moduri de descriptivi doriţi grafic dorit prezentare a rezultatelor Rezultatele sunt afişate în SPSS Viewer în forma de mai jos (dar unele sub altele. pentru fiecare în parte. rezultatele fiind afişate distinct.(►). Pot fi incluse mai multe variabile în această listă. prin acţionarea butoanelor din partea de jos a casetei se pot seta alte analize. aşa cum sunt aranjaţi aici): Indicatorii statistici descriptivi Tabelul de frecvenţe Histograma Procedura Descriptives . nu alăturat. Se va observa pe caseta de mai sus bifarea opţiunii pentru tabela de frecvenţe. care este funcţia specifică a acestei proceduri. În plus.32 - .

Această procedură vizează doar indicatorii statistici descriptivi.33 - . Caseta principală Explore • • În Dependent List se includ variabilele de analizat În Factor List se includ eventualele variabile categoriale. din Viewer Imaginea bazei de date. se Se aleg indicatorii doriţi din Options bifează opţiunea din stânga-jos a casetei ) Rezultatul analizei. se deschide caseta principală Descriptives. Satistics-Descriptives. în care se vede apariţia variabilei zscor (denumită automat de progarm) cu valorile transformate în scoruri z. Procedura Explore Procedura Explore este cea mai complexă dintre toate procedurile statisticii descriptive şi se poate utiliza atunci când se doreşte o analiză exhaustivă a variabilei (sau variabilelor). în funcţie de care se doreşte analiza variabilei analizate . La lansare. Se trec variabilele vizate în lista Variable(s) (dacă dorim calcularea scorurilor z.

permite setarea modului de tratare a valorilor lipsă Rezultatele analizei Explore. permite alegerea reprezentărilor grafice dorite: • Butonul Options. permite alegerea opţiunilor de afişare a rezultatelor numerice (Statistics). definită mai sus. permite etichetarea cazurilor la afişare (rar utilizat) Display. se prezintă astfel: Indicatorii statistici Reprezentarea stem-and-leaf Reprezentarea Box plot .34 - . implicit toţi indicatorii statistici descriptivi.• • • • Label cases by. grafice (Plots) sau ambele categorii (Both) Butonul Statistics deschide caseta pentru alegerea unor indicatori (dar procedura analizează. de bază) Butonul Plots.

Dintre variabilele psihologice ale cărei medii pentru populaţie este cunoscută. este inteligenţa. Aranjarea datelor Datele supuse testării trebuie să fie incluse într-o variabilă SPSS de tip numeric. dacă a fost evaluat nivelul de satisfacţie într-o organizaţie. exprimată în unităţi QI (μ=100). Procedura: Statistics-Compare Means-One Sample T Test Caseta principală Variabila testată este trecută în lista Test Variable(s) În zona Test Value se înscrie media populaţiei (100 în cazul nostru) Caseta Options permite alegerea pragului de semnificaţie. cum sunt cele antropometrice. cu atât normalitatea distribuţiei de eşantionare este mai sigură. de exemplu). însă. Condiţii de aplicare Condiţia teoretică de bază este normalitatea distribuţiei de eşantionare. Testul poate fi utilizat. Dacă populaţia are o extindere mare. Utilizarea acestui test statistic este condiţionată de cunoaşterea mediei populaţiei. atunci când populaţia are o extindere mai redusă. se poate testa diferenţa dintre nivelul de satisfacţie la nivelul unei secţii faţă de media satisfacţiei la nivelul întregii organizaţii (populaţie). Confidence Interval 95% este echivalent cu p=0.05 şi este implicit pentru toate testele statistice Variabila testată Rezultate .35 - . În temeiul teoremei limitei centrale. cu cât volumul eşantionului este mai mare. Atunci când volumul eşantionului este mic (N<30) este utilizată o variantă denumită testul t pentru un singur eşantion. acest lucru este dificil de realizat (în afara cazurilor în care există studii speciale.Teste parametrice Testul z (t) pentru media unui singur eşantion Utilizare Testul z pentru un singur eşantion este utilizat pentru se testa diferenţa dintre media unui eşantion faţă de media cunoscută a populaţiei din care face parte. De exemplu.

p=0.03. eroarea standard a mediei) Al doilea tabel include rezultatele testului statistic: t=6. .6) şi limitele inferioară (12. diferenţa faţă de media populaţiei (22. media.36 - . df=4. ab.63) ale intervalului de încredere pentru media populaţiei estimată de eşantionul de cercetare. Concluzia testului: media eşantionului de cercetare diferă semnificativ de QI=100.std.57) şi superioară (32.Primul tabel include statistica descriptivă a variabilei testate (N.254. ca medie a populaţiei.

formate din subiecţi diferiţi. în funcţie de apartenenţa la un grup sau altul.37 - . În acest caz. Procedura: Statistics-Compare means-Indpendent Samples T Test . cu două valori. Dacă variabila dependentă nu întruneşte condiţiile pentru testul t. aşa cum vom vedea mai jos. Unul dintre acestea este testul Levene. se poate apela la teste neparametrice. scorul la sociabilitate este variabila dependentă. Exemplu: testarea diferenţei dintre media scorului la o scală de sociabilitate aplicată unor copii crescuţi în familie şi unor copii crescuţi în instituţii de ocrotire. Din principiu. exprimată pe scală nominală dihotomică (familie/instituţie de ocrotire) Condiţii Teoretic. testul t poate fi utilizat pentru eşantioane oricât de mici. recomandăm cea de a doua variantă. astfel: • Testul z pentru proporţii (compararea procentului de „sociabili” din cele două grupuri) • Testul Mann-Whitney U. În ce priveşte condiţia egalităţii varianţei. ea este testată cu un teste specifice. iar în funcţie dacă rezultatul său programul calculează testul t pe două căi. însă.Testul t pentru eşantioane independente Utilizare Testul t pentru eşantioane independente este utilizat pentru testarea diferenţei dintre mediile aceleiaşi variabile dependente măsurate pe două grupuri. Variabila independentă poate fi de tip „string” (codificând cele două grupuri cu valori de genul „A” şi „B”) sau de tip numeric (cu codificarea convenţională 1 şi 2). de tip numeric. şi variabila independentă. dacă distribuţia de eşantionare pentru cele două grupuri este normală şi dacă varianţa valorilor în cele două grupuri nu diferă semnificativ. de tip nominal. dacă se transformă valorile variabilei „sociabilitate” în valori de rang Aranjarea datelor Tabela de date SPSS va conţine variabila dependentă. măsurată pe scală cantitativă (interval/raport) iar mediul de educare este variabila independentă.

sugerând introducerea valorilor care definesc cele două grupuri. se activează butonul Define Groups a cărui acţionare deschide caseta secundară Define Groups. Rezultate . Concomitent. programul ataşează variabilei dependente două semne de întrebare. După acţionarea butonului Continue. caseta principală devine completă şi se poate acţiona OK pentru efectuarea testului.În caseta principală se trece variabila dependentă (soc) în lista Test Variable(s) (pot fi testate mai multe variabile simultan) iar variabila independentă (grup).38 - . unde se introduc valorile care definesc cele două grupuri comparate (ordinea lor nu este relevantă). în zona Grouping Variable. În acest moment.

045. Dacă acestea nu ar fi fost definite.666.666. 2. Al doilea tabel are două linii: Pe prima avem rezultatele testului t pentru cazul asumării omogenităţii varianţei (Levene’s Test for Equality of Variances). Se va observa că programul descrie grupurile prin intermediul etichetelor valorilor. deci mai mare de 0. pe care nu o discutăm aici).71). Sig.=0.În primul tabel (Group Statistics) avem statistica descriptivă a celor două grupuri.42. în loc de „institutie” şi „familie” ar fi apărut 1. Pentru exemplul nostru. ele sunt egale (Sig. Pe a doua linie avem rezultatele testului t pentru cazul în care nu s-ar întruni condiţia de omogenitate a varianţei pentru cele două grupuri. vom citi pe această linie rezultatul testului: t=-2. conform căreia copiii crescuţi în mediu familial sunt mai sociabili (m=22. respectiv. rezultatul testului t permite acceptarea ipotezei cercetării. rezultatului testului t s-ar fi citit pe această linie.39 - .=0. Dacă semnificaţia testului Levene ar fi fost mai mică sau egală cu 0.00) decât cei crescuţi în mediu instituţional (m=17. . În cazul nostru. Ca urmare.05.05 pentru distribuţia F a testului Levene. ceea ce se traduce ca o valoare p=0. df=12.

supuse fiecare. rezultatul ei este echivalent cu al testului t pentru grupuri independente (menţionăm. Această condiţie se numeşte omogenitatea varianţei. Cu cât volumul grupurilor supuse comparaţiei este mai mare. fapt ce justifică aplicarea testului ANOVA. care conţine valorile timpului de reacţie. anterior evaluării vitezei de reacţie. • Varianţa valorilor variabilei dependente în interiorul grupurilor definite prin valorile variabilei independente trebuie să fie egală. „medie” sau „mare”. analiza de varianţă este utilizată pentru a testa semnificaţia dintre mediile măsurate pe mai mult de două grupuri independente (compuse din subiecţi diferiţi). se vor analiza cu atenţie cazurile care prezintă valori extreme. Dacă se utilizează ANOVA pentru a testa diferenţa dintre două medii obţinute pe grupuri independente. În orice caz. Exemplu: Se compară media timpului de reacţie pentru trei grupuri experimentale. care este destul de robust şi în acest caz. însă.40 - . În acest caz valorile variabilei dependente sunt exprimate pe scală cantitativă (I/R) iar valorile variabila independentă este de tip categorial. Încălcarea acestei condiţii nu invalidează testul ANOVA. cu atât aspectele legate de normalitatea distribuţiei au un efect mai mic asupra ANOVA. Condiţii • Variabila dependentă trebuie să fie de tip I/R şi să respecte condiţia de normalitate a distribuţiei de eşantionare pentru fiecare dintre grupurile supuse comparaţiei. Din fericire. care au un efect important asupra varianţei. 3=şoc mare) şi variabila dependentă. . Aranjarea datelor Se construieşte o variabilă independentă (definită ca „factor” în contextul ANOVA) care conţine codurile de apartenenţă a cazurilor la fiecare dintre grupurile supuse analizei (în cazul nostru 1=şoc mic. testul F este remarcabil de robust în cazul încălcării acestei condiţii. că această utilizare este neuzuală). unui şoc electric de intensitate „mică”. Egalitatea (omogenitatea varianţei) poate fi testată cu testul Levene. ANOVA este mai vulnerabilă în situaţia când distribuţia variabilei dependente este prea aplatizată sau prea înaltă (kurtosis≠0) decât în cazul asimetriei (skewness≠0). În acest caz s-ar putea obiecta că variabila independentă se exprimă pe o scală ordinală dar. 2=şoc mediu. în esenţă.Analiza de varianţă unifactorială (One Way ANOVA) Utilizare În mod obişnuit. ea este de tip categorial.

41 - . pentru testarea diferenţei dintre medii luate două câte două. . Caseta principală One-Way ANOVA: Variabila dependentă de trece în lista Dependent List (pot fi testate mai multe variabile simultan) Variabila independentă se trece în zona Factor. În caseta Options. Pentru că nu ştim incî dacă varianţa este omogenă.. vom bifa câte un test pentru fiecare caz (Bonferoni. pentru varianţă omogenă). În imagine baza de date SPSS este ordonată după variabila „shoc” dar acest lucru nu este necesar pentru procedura de calcul.Se va reţine că procedura ANOVA nu suportă variabila independentă de tip „string”. pentru varianţă neomogenă şi Tamhane T2. bifăm Descriptives. Procedura: Statistics-Compare Means-One-Way ANOVA. Caseta Post Hoc Multiple Comparison: Se aleg testele de analiză post-hoc.. Homogeneity-of-variance şi Means Plot.

988).000 nu se va înţelege ca p=0 ci ca p<0.000.42 - . Tabelul Test of Homogeneity of Variance conţine rezultatul testului Levene.După finalizarea setărilor se apasă OK pe caseta principală şi se analizează rezultatele. O valoare neseminificativă a acestuia (cum este cazul nostru p=0. Reamintim că comparaţiile repetate dintre mediile a mai mult de două grupuri conduc la acumularea de eroare de tip I. Tabelul Post Hoc Tests – Multiple Comparisons prezintă comparaţiile mediilor celor trei grupuri. În raportul de cercetare este chiar recomandabil să nu se utilizeze valoarea 0.264 pentru un prag p=0. luate două câte două. Testele post-hoc sunt .001. Atenţie. Rezultate Tabelul Descriptives prezintă indicatorii descriptivi ai variabilei dependente pentru grupurile analizate.000 care poate sugera „certitudinea” rezultatului. p=0. Tabelul ANOVA conţine rezultatului testului F a cărui valoare este 35. conduce la concluzia că dispersiile în interiorul celor trei grupuri sunt omogene).

520).43 - . provine cu precădere de la efectul pe care îl are şocul „mare”. care provoacă o încetinire a timpului de reacţie consistentă faţă celelalte două categorii de şoc electric.05). Aşa cum se poate observa. Având în vedere că testul Levene a confirmat omogenitatea varianţei. Cu alte cuvinte. grupul supus unui şoc „mic” diferă de grupul supus unui şoc „mare” (p<0.001). variaţia semnificativă a timpului de reacţie în funcţie de cele trei categorii de intensitate a şocului electric. putem constata faptul că timpul de reacţie dintre grupul supus şocului de mica intensitate şi cel supus şocului de medie intensitate nu diferă semnificativ (p=0. Aceasta concluzie este întărită şi de reprezentarea grafică a mediei timpului de reacţie ale celor trei grupuri. Valorile aunt uşor de analizat: În prima coloana avem definite grupurile analizate (etichetarea valorilor variabilei independente ajută mult la inteligibilitatea tabelului). s-ar fi citit cele pentru testul Tamhane).001). timpul de reacţie creşte mai accentuat la grupul cu şoc „mare” în timp ce mediile primelor două niveluri de şoc sunt relativ apropiate. se vor citi valorile pentru testul Bonferoni (în caz contrar. .) se află semnificaţiile pentru diferenţa dintre medii. Astfel. În acelaşi timp. Totuşi. la fel ca şi în cazul comparaţiei dintre grupul cu şoc „mediu” şi cel cu şoc „mare” (p<0. ele nu vor fi în nici un caz luate în considerare dacă testul F nu atinge pragul de semnificaţie statistică (p<0. În coloana a patra (Sig.astfel în concepute încât să minimizeze acest neajuns.

Aranjarea datelor Vor fi create două variabile distincte. ambele cantitative. ori în două contexte diferite.44 - . prin faptul că baza de calcul este diferenţa dintre cele două valori ale fiecărui subiect în parte. În situaţia în care condiţia nu se îndeplineşte. ulterior. teorema limitei centrale determină normalizarea distribuţiei de eşantionare pe măsură ce volumul eşantionului creşte. Condiţii Condiţia teoretică a testului este normalitatea distribuţiei de eşantionare a distribuţiei de diferenţe. în condiţii de zgomot puternic. Ca şi în celelalte cazuri.Testul t pentru eşantioane dependente (perechi) Utilizare Testul t al diferenţei mediilor a două eşantioane dependente permite evaluarea semnificaţiei variaţiei unei anumite caracteristici la aceeaşi indivizi în două situaţii diferite (de exemplu. se pot utiliza teste neparametrice echivalente: testul semnului (pentru date nominale) sau testul Wilcoxon (pentru date ordinale). măsurate pe scală de tip I/R. Avantajul major al acestui model statistic este acela că surprinde variaţia numită „intrasubiect”. Ipoteza cercetării este că zgomotul determină o reducere a capacităţii de calcul numeric. „înainte” şi „după” acţiunea unei anumite condiţii. care primesc câte o valoare pentru fiecare subiect. . indiferent de momentul manifestării acestora). Exemplu: Un grup de subiecţi efectuează operaţii aritmetice în condiţii de linişte şi.

Al doilea tabel conţine testul de corelaţie Pearson (r) dintre cele două variabile. O dată constituită..45 - . Caseta Options permite alegerea pragului de semnificaţie (implicit 0. Astfel se constituie perechea de variabile în zona Curent selection. perechea de variabile se trece în lista Paired Variables cu butonul de transfer (►). pe rând. Se selectează cu un clic de mouse. . Rezultate Primul tabel conţine statistica descriptivă pentru cele două variabile.. Evaluarea intensitatea asocierii liniare dintre cele două variabile este legitimă în acest context. Pot fi create mai multe perechi de variabile şi prelucrate simultan.Procedura: Statistics-Compare Means-Paired Sample T Test.05). dar oferă o informaţie diferită de testul diferenţei dintre medii. fiecare dintre cele două variabile. Alegerea testului de corelaţie sau al testului t se decide în funcţie de obiectivul cercetării.

pentru cazul în care condiţiile pentru utilizarea testului Pearson nu se îndeplinesc. df=9. Absenţa oricărei legaturi (corelaţii) dintre variabile se traduce prin r=0. Condiţii Condiţia principală pentru calcularea coeficientului de corelaţie liniară Pearson este ca variabilele implicate să fie măsurate pe scală de interval/raport (alături de existenţa unei forme a distribuţiei care nu se abate sever de la curba normală). sunt: testul chi-pătrat (pentru date nominale) sau coeficienţii de corelaţie Spearman sau Kendall (pentru date ordinale).46 - . Pentru exemplificare. Exemplu: Testul de corelaţie implică două variabile dar. zgomotul afectează capacitatea de calcul aritmetic. să luăm în considerare situaţia în care se urmăreşte evidenţierea legăturii (asocierii) dintre anxietate şi agresivitate. şi preferinţa pentru risc pe de altă parte. Acesta permite respingerea ipotezei de nul şi acceptarea ipotezei cercetării. Coeficientul de corelaţie liniară Pearson (r) Utilizare Corelaţia Pearson (r) măsoară gradul de asociere dintre variabile. după un model de tip liniar. pe de o parte. p=0.În fine. Aceasta se referă la gradul şi sensul de variaţie concomitentă a valorilor unei variabile în raport cu cealaltă. adesea. Acest fapt conduce la ceea ce se numeşte o matrice de corelaţii care este un tabel ale căror celule cuprind corelaţiile dintre perechile de variabile. Domeniul de variaţie a coeficientului de corelaţie Pearson (r) este între r=-1 (corelaţie perfectă negativă) şi r=+1 (corelaţie perfectă pozitivă). într-o cercetare psihologică numărul variabilelor supuse corelaţiei este mai mare de două.001.076. ultimul tabel prezintă rezultatul testului: t=5. Aranjarea datelor Se creează variabile distincte pentru fiecare caracteristică supusă testării. Procedura: Statistics-Corelate-Bivariate Variabilele supuse corelaţiei vor fi trecute în lista Variables: . Testele neparametrice alternative.

este Pearson. Acest lucru este util atunci când matricea de corelaţie este mare. odată sub diagonală. dacă datele sunt neparametrice.47 - .05 şi cu două asteriscuri a celor semnificativi la p=0. Corelaţiile variabilelor cu ele însele sunt perfect pozitive (r=1) şi nu prezintă. Tipul implicit de testare a ipotezei este bilateral (Two-tailed). odată deasupra diagonalei. dar se poate alege unilateral (dacă există o justificare solidă). din zona Correlation Coefficients. pentru a scoate în evidenţă valorile semnificative ale lui r. Rezultate Tabelul rezultatelor cuprinde matricea de corelaţii a variabilelor analizate. nici un interes. deoarece prezintă aceleaşi corelaţii de două ori. dar se poate bifa un altul (Kendall sau Spearman).Testul implicit. El este redundant.01. Fiecare celulă include următoarele informaţii: • valoarea lui r • nivelul p • numărul de subiecţi (N) . Flag significant correlations. desigur. determină marcarea cu un asterisc a coeficienţilor semnificativi la p=0.

001) între agresivitate şi preferinţa pentru risc. Nu pot fi incluse mai multe clauze WITH în aceeaşi procedură. consemnăm corelaţii negative dar nesemnificative între anxietate şi agresivitate (r=-0. p=0. p<0. p=0. În acelaşi timp. Precizăm faptul că raportarea coeficienţilor de corelaţie se face cu două zecimale. se constată o corelaţie semnificativă (r=0. Dezavantajul acestui tip de tabel constă în faptul că avem de fapt o dublă prezentare a corelaţiilor. se inserează cuvântul WITH. prezentată mai sus.96. inseraţi WITH Mai departe. dacă avem grijă să le aşezăm separat în listă şi să includem clauza WITH între cele două categorii de variabile. În acest caz. Pentru corelaţii implicând multe variabile tabelul se va cit cu relativă dificultate. Bivariate Correlations. nu şi de corelaţia dintre anxietate şi agresivitate.În cazul nostru. deasupra diagonalei şi sub diagonală. în caseta principala.24). şi între anxietate şi preferinţa pentru risc. pe de o parte.38. se selectează întreaga procedură (cu ajutorul mouse-ului) şi se apasă pe butonul Run (►) de pe bara de comenzi a ferestrei Rezultatul din Viewer va arăta ca mai jos: Este evident că această modalitate se poate aplica pentru oricât variabile. ca o fereastră distinctă. al cărui efect este deschiderea domeniului Syntax. pe linia /VARIABLES=anx agresiv risc. pe de altă parte (r=-0. . Apoi se apasă butonul Paste. variabilele vor fi introduse astfel încât variabila „preferinţa pentru risc” sa fie ultima din listă. Să presupunem că suntem interesaţi de corelaţiile dintre anxietate şi agresivitate cu variabila preferinţă pentru risc.48 - . având grijă să existe spaţiu atât în stingă cât şi în dreapta sa. chiar dacă programele îi calculează cu trei zecimale.40. Acolo.26). în care se află sintaxa procedurii de corelaţie.

Ulterior. . putem reveni în fereastra Syntax pentru a o închide (cu File-Close). Se apasă OK şi se obţine graficul din imaginea următoare. Trecem variabila Agresivitate pe axa Y şi variabila Preferinţa pentru risc pe axa Z (se poate la fel de bine şi invers).. Expresia grafica a corelaţiei (Scatterplot) Caracterul şi intensitatea corelaţiei dintre două variabile se evidenţiază extrem de sugestiv cu ajutorul unei proceduri grafice specifice. care deschide următoarea casetă de dialog: În cazul nostru.. singura semnificativă. care sugerează foarte clar existenţa unei asocieri de tip liniar între cele două variabile.49 - . să presupunem că dorim reprezentarea grafică a corelaţiei dintre agresivitate şi preferinţa pentru risc. numită scatterplot. În acest scop. selectăm pe caseta Scatterplot opţiunea Simple şi apăsăm Define. Aceasta se lansează din meniul principal Graphs-Scatter. salvând sau nu procedura astfel modificată.

ca cea obţinută mai sus.92. . De fapt. motiv pentru care este recomandabilă utilizarea frecventă a acesteia.Reprezentarea grafică este sursă de informaţii cu privire la natura relaţiei dintre variabile.50 - . decât că sunt distincte. între agresivitate şi preferinţă pentu risc. sau nesemnificativă. deoarece graficul poate scoate în evidenţă o legătura de alt tip decât liniară.  O corelaţie r=0. ar trebui să concluzionăm mai degrabă că cele două variabile se confundă. ea este necesară în special atunci când valoarea corelaţiei este redusă. dacă s-ar întâmpla să apară. Mai mult. este improbabil să se întâlnească într-un studiu real.

se poate estima pe baza agresivităţii riscul de accident încă înainte de dobândirea carnetului de şofer. deoarece regresia liniară este o aplicaţie a acesteia. în care există o singură variabilă predictor (agresivitatea) şi o variabilă criteriu (tendinţa spre risc) se numeşte regresie liniară simplă. care efectuează predicţii bazate pe mai multe variabile predictor asupra unei variabile criteriu. Acest fapt poate sugera o relaţie de tip cauzal între variabile.51 - . la conducătorii auto.Regresia liniară simplă Utilizare Analiza de regresie este o aplicaţie a corelaţiei. utilizată în scopuri de predicţie. Acest tip de regresie. de regulă. evaluarea variabilei predictor anterior variabilei criteriu. ca o formă de introducere în analiza de regresie. evaluate anterior începerii cursului de statistică. Condiţii Din punct de vedere statistic. . Dacă evaluăm agrsesivitatea ca trăsătură de personalitate şi preferinţa pentru risc ca expresie a numărului de incidente în trafic. mai uşor de înţeles. predicţia presupune. Vom prezenta mai jos regresia liniară simplă. Din punct de vedere metodologic. Aranjarea datelor Structura de variabile este similară analizei de corelaţie. Mai frecvent utilizată este regresia multiplă. condiţiile variabilelor care sunt supuse analizei de regresie sunt aceleaşi ca în cazul corelaţiei. Exemplu: Predicţia rezultatului statistică pe baza cunoştinţelor de matematică. dar numai dacă sunt întrunite şi alte condiţii (cum ar fi izolarea efectelor altor variabile).

se trece variabila criteriu în zona Dependent iar variabila criteriu în zona Independent(s). cu ajutorul cărora se poate estima în viitor performanţa la statistică pe baza rezultatului la un test de cunoştinţe matematice aplicat în prima zi de şcoală. analiza de regresie începe cu coeficientul de corelaţie dintre variabile şi vizualizarea imaginii scatterplot. am obţinut o corelaţie r=0.. sau originea dreptei de regresie) şi b (panta dreptei de regresie). În cazul nostru.5476. Aceste valori confirmă existenţa unei legături pozitive semnificative.002).. . necunoscute în această fază1. bifăm Estimates pentru obţinerea coeficienţilor de regresie (opţiune implicită) 1 Facem precizarea că valorile şi aprecierile nu se bazează pe un studiu reale. o astfel de procedură s-ar justifica mai ales pentru identificarea studenţilor cu potenţiale dificultăţi şi care. În caseta principală Linear Regression. care vor avea ca efect crearea de variabile distincte în baza de date. Lansarea procedurii: Statistics-Regression-Linear. Acesta ne spune că 54% din variaţia „performanţei la statistică” este explicată de variaţia valorilor la variabila „cunoştinţe de matematică”.74 (p=0. O idee mai exactă ne oferă coeficientul de determinare r2=0. bifăm Predicted Values-Unstandardized şi ResidualsUnstandardized. În caseta Statistics.Procedura: În principiu. tocmai fiind avertizaţi în legătură cu aceste dificultăţi vor putea să acorde statisticii o atenţie sporită. Pe baza acestor concluzii se poate trece la analiza de regresie a cărei finalitate este aceea de obţinere a coeficienţilor a (termenul liber. În caseta Regression Save.52 - . între cunoştinţele de matematică şi performanţa la statistică. în vederea obţinerii unui rezultat peste nivelul celui prezis. urmând procedura prezentată mai sus. Deducem că restul de 46% din performanţa la statistică este explicată de alte variabile. Neîndoielnic. Prediction interval (individual) va calcula limitele de încredere pentru valorile prezise.

care este coeficientul de determinare al lui R. care pot fi utilizaţi. la fel ca şi pentru R2.854 este panta dreptei de regresie. care este identic cu coeficientul de corelaţie dintre cele două variabile.406 + 0.53 - . la alegere. notat cu R. Astfel. se poate estima performanţă finală la statistică cu ajutorul relaţiei: stat _ fin = a + b * mat _ in = 3. R ar fi fost coeficientul de corelaţie multiplă dintre predictori şi criteriu.02 unde 3. Valoarea lui ne spune că 55% din variaţia performanţei la statistică este explicată de variaţia variabilei „cunoştinţe de matematică”. Analiza rezultatelor Tabelul Model Summary oferă valoarea coeficientului de regresie. . dacă un student realizează un scor de 30 la testul de cunoştinţe de matematică. în ecuaţia de predicţie.406 este originea iar 0. Interpretarea este similară coeficientului de corelaţie simplă. Dacă modelul de regresie ar fi avut mai multe variabile predictor. Valorile prezise sunt valorile rezultate pe baza modelului de predicţie. „Adjusted R Square” este o corecţie a lui R2 în funcţie de numărul de predictori şi numărul de subiecţi. de exemplu.854 * 30 = 29.  Valorile reziduale se calculează ca diferenţă între valorile variabilei criteriu si cele prezise pe baza modelului de regresie. Tabelul Coefficients conţine coeficienţii B (nestandardizaţi) şi coeficientul beta (standardizat).

05). cu setările de mai sus.Sau. conţine diferenţa dintre valoarea reală şi valoarea prezisă Variabilele lici_1 şi lici_2.93 = 0. atâta timp cât corelaţia dintre variabile nu este perfectă. Desigur. 0.69 În acest caz termenul liber are valoarea 0. în baza de date apar câteva variabile noi. Cu un nivel de încredere de 95% (echivalent cu o probabilitate de eroare de 0. Iar estimările conţin cu atât mai multă eroare cu cât corelaţia dintre variabile este mai mică (punctele graficului de corelaţie fiind mai îndepărtate de dreapta de regresie). rezultatele conţin şi imaginea scatterplot a relaţiei dintre valorile mat_in şi scorurile z ale variabilei pre_1. conţin limitele inferioară şi superioară ale intervalului de încredere pentru fiecare valoare în parte. În fine. să privim prima valoare prezisă de pe coloana pre_1 (25.93). Variabila res_1. atunci: stat _ fin = beta * mat _ in = 0. dacă predicţia se face pe baza unui scor standardizat z al variabilei mat_in (să zicem.77 şi 29. . putem spune că valoarea adevărată pentru stat_fin prezisă pe baza valorii mat_in=26.41. scorurile astfel prezise sunt estimări. deoarece originea dreptei pentru scoruri standardizate se află în 0.598). Variabila pre_1.54 - . s-ar afla în intervalul 21. aşa cum se vede în imaginea de mai jos. conţine valorile prezise pe baza modelului de regresie. Pentru a înţelege mai bine problema limitelor.742 * 0. La finalul procedurii analizei de regresie.

55 - . punând în evidenţă abaterile de la modelul liniar... în felul următor: .se acţionează dublu clic de mouse pe imaginea graficului din Viewer.se execută procedura Chart-Options-Fit Line.Imaginea este identică cu ceea ce am prezentat în cazul corelaţiei. corelaţia sau regresia? Corelaţia şi regresia liniară sunt similare şi. În unele situaţii pot fi utilizate ambele proceduri. fapt care se poate datora faptului că relaţia dintre variabile nu urmează un model liniar (vezi exemplul din prima secţiune a manualului. Dacă se alege alt model decât cel liniar (de exemplu. Singura deosebire este dată de trasarea dreptei. de aceea.. uşor de confundat. în care. . Aceasta se face de către operator.graficul este trecut deschis într-o fereastră individuală de editare. Ce utilizăm. . . Acest lucru este cu deosebire util atunci când corelaţia este mică. Quadratic regression) se va obţine linia de regresie sub formă curbilinie.Fit Options. Facem precizarea că acest procedeu de trasare a liniei în interiorul scatterplotului este utilizabil şi în cazul corelaţiei. La capătul acestei serii de acţiuni apare caseta de mai jos unde se marchează Linear regression. bazat pe corelaţia dintre scorurile z şi probabilităţile de sub curba normală).. prin care.

în timp ce dacă se inversează ordinea variabilelor în calcularea corelaţiei.Se calculează corelaţia liniară: • atunci când există două variabile măsurate pe aceiaşi subiecţi şi se doreşte evaluarea gradului de asociere între variabile • atunci când distribuţiile de eşantionare ale celor două variabile sunt normale (atunci când cel puţin una dintre variabile este manipulată. . inversând variabilele în ecuaţia de regresie se va obţine o linie de regresie diferită. calculele regresiei nu sunt simetrice.56 - . se calculează regresia • atenţie. se obţine acelaşi coeficient r. ca urmare. nu se calculează corelaţia Pearson) Se calculează regresia liniară: • atunci când una dintre variabile precede şi poate fi cauza celeilalte variabile • atunci când una dintre variabile este manipulată.

este acela că încă din primii ani de studiu studenţii la psihologie se află în situaţia de a utiliza instrumente psihologice sau de a le crea ei înşişi (cel mai adesea chestionare). cunoştinţă). ori modificarea lor în spiritul atributului măsurat. mică sau. În mod normal. să coreleze unii cu alţii şi. atât între ei cât şi fiecare dintre ei cu rezultatul aditiv al tuturor itemilor (scala. aceasta înseamnă ca itemii din care este constituit (întrebări sau sarcini de altă natură) să contribuie la constituirea semnificaţiei unui construct psihic anume: scala unui chestionar. altul. În esenţa ea este o aplicaţie a corelaţiei. este metoda statistică prin care se verifică respectarea exigenţelor enunţate mai sus.70 fiind acceptat de majoritatea cercetătorilor ca prag limită de validare a criteriului de consistenţă internă. este unul dintre obiectivele analizei de itemi. Corelaţia dintre un item şi scorul total. sau o formă alternativă echivalentă. pentru a fi considerată consistentă. . să coreleze fiecare cu scorul care reflectă atributul respectiv.Analiza de consistenţă internă (Cronbach alfa) Utilizare Una din condiţiile fundamentale a unui instrument de evaluare psihologică este aceea de a fi sigur şi consistent. Din moment ce toţi itemii trebuie sa reflecte un anumit atribut. care are o plajă de variaţie între 0 şi 1. comportament. din care se omite acel item. Întrebările unui chestionar sau itemii unui test de performanţă sunt concepuţi pentru a măsura un anumit atribut (atitudine. cu evaluări succesive ale relaţiilor dintre itemi şi dintre itemi şi scorul global. Analiza de consistenţă internă. Fără a fi singura procedură statistică utilizabilă în astfel de situaţii. Exprimat cu alte cuvinte. merge în altă direcţie decât acesta. ne oferă o indicaţie cu privire la relevanţa itemului respectiv pentru rezultatul global al testului. şi operarea selecţiei itemilor în funcţie de relaţia lor cu acesta. O altă faţetă a consistenţei unui instrument este siguranţa sa în aplicări repetate. fiind utilizat ca un indicator al preciziei de măsurare a unui test. Ea poate fi descrisă ca stabilitate a scorului atunci când acel instrument. prin calcularea coeficientului Cronbach alfa. ceea ce reprezintă unul din motivele pentru care o tratăm aici. Al doilea motiv. al consistenţei interne şi fidelităţii unui instrument psihologic. Identificarea şi eliminarea acestor itemi.60. coeficientul Cronbach alfa este de departe cel mai cunoscut dintre toate. Atunci când fiecare item este relevant. Oricum.57 - . în acelaşi timp. etc. nivelul de 0. scorul global). În acest scop. ei trebuie să manifeste o varianţă comună. Unul dintre acestea este timpul consumat cu aplicarea lor. Dar utilizarea unor teste cu mulţi itemi este neconvenabilă din mai multe motive. trebuie să atingă o valoare cât mai aproape de 1. Ea are un caracter recursiv. valoarea indicelui Cronbach alfa tinde să crească pe măsură ce numărul itemilor creşte. poate încă şi mai important. factor. valoarea lui Cronbach alfa nu poate fi mai mică de 0. evaluarea consistenţei interne este o etapă absolut obligatorie în elaborarea şi finalizarea respectivului instrument. scorul la o caracteristică psihică de performanţă. dimpotrivă. este aplicată aceloraşi subiecţi. O scală. putem spune că testul respectiv este are „consistenţă internă”. Criteriul de bază pentru această operaţie este valoarea indicelui Cronbach alfa. un instrument este sigur şi consistent atunci când itemii din care este compus corelează. poate fi inutilitatea de a păstra itemi a căror contribuţie la scorul global este nulă. În mod practic şi direct exprimat. Consistenţa internă se defineşte ca proprietatea itemilor de a corela cu „scorul global” al testului sau scalei din care fac parte.

variabilele trebuie să conţină valori care exprimă semnificaţia răspunsului în raport cu scala globală. Valorile înregistrate pentru răspunsuri vor fi valorizate în funcţie de semnificaţia lor în raport cu rezultatul global (scala). în funcţie de semnificaţia contribuţiei lor la construirea scorului global.Coeficientul de consistenţă internă Cronbach alfa se calculează în următoarele situaţii: • atunci când realizăm un instrument nou • atunci când se traduce un instrument vechi într-o altă limbă • atunci când un instrument utilizat în anumite condiţii. Cu alte cuvinte. . desigur). urmează a fi utilizat în cu totul alte condiţii (de exemplu. Toate prelucrările care urmează sunt efectuate pe datele complete.. Codurile convenţionale ale variantelor de răspuns vor fi transformate în valori. Într-o asemenea situaţie.. respectiv 2. pot exista întrebări pentru care varianta „1” aduce un punct la scala iar varianta „2” aduce zero puncte la scală. pentru evaluarea atitudinii faţă statistică. Procedura: Statistics-Scale-Reliability Analysis. De exemplu.58 - . Imaginea redă rezultatele primilor opt subiecţi la o scală cu 10 itemi. trecerea la utilizarea computerizată a unui test aplicat până atunci în regim creion hârtie). În acelaşi mod se va opera şi pentru itemii care au mai multe variante de răspuns. cum este cazul scalelor de tip Likert. şi nu răspunsul efectiv al subiectului. de tip Lickert. pentru analiza de itemi valorile codificate de răspuns vor fi transformate în valori corespunzătoare (0 şi 1). dacă variantele de răspuns sunt codificate cu 1. Condiţii Crearea unor variabile distincte care conţin răspunsurile la fiecare item (întrebare). Aranjarea datelor Baza de date va conţine variabile pentru fiecare dintre itemii supuşi analizei (aceasta nu înseamnă că nu pot exista şi alte variabile.

• Scale (analiza scorului global) • Scale if item deleted (analiza scorului fără contribuţia unui anumit item) În zona Inter-item se va bifa Corelations. Testele pentru gradul de corespondenţă (goodness-of-fit). În zona Summaries se poate cere calcularea unor indicatori descriptivi pentru fiecare dintre itemii analizaţi (media.În caseta principală. În practică. corelaţii). coeficientul de fidelitate Guttman. variabilele itemilor vor fi trecuţi în lista Items (imaginea surprinde momentul în care mai sunt de trecut itemii de la 6 la 10). Pentru analiza de consistenţă internă se alege modelul Alfa. varianţa. . coeficientul alfa pentru fiecare jumătate. de la 1 la 6 • Modele paralele şi strict paralele. bifarea opţiunilor marcate pe caseta din imaginea de mai sus oferă informaţiile cele mai importante pentru analiza itemilor unui test. Coeficienţii lambda. se fac setări de analiză prin deschiderea casetei Statistics: În zona Descriptives se vor bifa opţiunile: • Item (analiza fiecărui item separat). Celelalte opţiuni sunt explicitate în Help-ul casetei şi pot fi utilizate pentru o analiză mai rafinată a datelor. Calculează Cronbach alfa care pentru date dihotomice este echivalent cu coeficientul Kuder-Richardson 20 (KR20) • Split-half. coeficientul Spearman-Brown. • Modele Gutman. În continuare. În lista Model se poate alege unul dintre următoarele modele de analiză: • Alfa. covarianţa. pentru a obţine matricea de corelaţii dintre itemi. varianţa comună. Reliability Analysis.59 - . şi alte caracteristici ale raporturilor dintre itemi. Pentru corelaţia dintre forme paralele.

valori extrem de ridicate ale unor corelaţii. cu setările de mai sus ne oferă următoarele categorii de informaţii: Tabelul de mai sus cuprinde lista itemilor.Rezultate În continuare vor fi analizaţi un cei 10 itemi ipotetici. Pe de altă parte. aleşi doar în scop didactic. ar putea sugera că itemii respectivi prezintă un grad de similitudine care nu justifică . aproape de 1. Din tabelul alăturat rezultă că itemii i_02 şi i_03 tind să se asocieze negativ cu majoritatea celorlalţi itemi. fapt care sugerează răspunsuri grupate spre valorile mici. Pentru o scală reală acest număr ar fi cu totul insuficient. Tabelul Correlation Matrix oferă o imagine a gradului de asociere dintre itemi. Ca regulă generală. Valorile sunt utile. Rularea procedurii.60 - . fiind un semn al unei posibile probleme de construire respectivilor itemi. . pentru a sesiza itemii care tind să aibă relaţii negative cu ceilalţi. se poate constata că media itemului I_02 este mai mică decât a celorlalţi. Analiza valorilor permite evidenţierea tendinţei centrale şi a împrăştierii răspunsurilor pentru fiecare item. Eventuale anomalii pot fi sesizate încă din această fază. pe de o parte. Şi această pentru că analiza de itemi este un proces selectiv care are drept scop alegerea itemilor adecvaţi pentru constituirea unei scale cu cel mai ridicat nivel de consistenţă internă posibilă. De exemplu. media abaterea standard şi numărul cazurilor. numărul itemilor din faza de dezvoltare a unui astfel de instrument ar trebui să aibă cel puţin dublul numărului de itemi pe care îl preconizăm la final.

Contribuţia sa la construcţia scalei este extrem de mică. atunci singura soluţie posibilă este eliminarea itemilor în cauză.std. . ab. Dacă privim prima dintre aceste două coloane. dacă respectivul item ar fi eliminat). de exemplu itemi formulaţi extrem de asemănător). În fine. nici nu strică dar nici nu ajută. Tabelul următor conţine un set de indicatori statistici descriptivi la nivelul întregii scale. nesemnificativă. observăm că doi dintre itemi (i_03 şi i_09) au corelaţii negative cu scorul global. de asemenea. rezultată prin însumarea răspunsurilor la fiecare item (medie. că itemul i_02 are o corelaţie extrem de mică cu scorul global (0. cea mai importantă dintre categoriile de informaţii. ) sau al itemilor. Observăm. consumă timpul subiectului pentru a răspunde. dimpotrivă. merg într-o direcţie opusă acestuia.61 - .015). În acest caz trebuie să verificăm dacă valorile itemului respectiv au fost corect codificate. este tabelul Item-total Statistics. varianţă. în schimb. Cu alte cuvinte. Două dintre coloanele alăturate au o importanţă particulară: Corected Item-Total Correlation (corelaţia dintre fiecare item şi scorul global) şi Alpha if Item Deleted (valoarea lui Cronbach alfa. care include relaţiile dintre itemi şi scorul global. Dacă da. Aceasta înseamnă că ei nu numai că nu aduc informaţie utilă în raport cu atributul măsurat ci.utilizarea lor în aceeaşi scală (ar putea fi.

care este 0. Ca urmare. vedem că prin eliminarea oricărui item nu am obţine o valoare mai ridicată decât 2 Deşi programele computerizate îl calculează cu un număr mai mare de zecimale. se observă că itemul i_02. În general. În orice caz. Următoarea fază este reluarea prelucrării. În plus. în primul rând a celor care corelează negativ cu scorul global. pentru simplul motiv că nu contribuie la constructul psihologic vizat.75. chiar şi itemii pozitivi. care au corelaţii cu scala mai mici de 0. valoarea lui Cronbach alfa creşte la 0.62 - . a dobândit o corelaţie negativă cu scala. .1 nu trebuie păstraţi. dar itemii negativi pot fi scoşi toţi odată. De altfel. fără reţineri. cu eliminarea itemilor negativi din lista Items din caseta principală. Iată care este rezultatul eliminării itemilor 3 şi 9 asupra consistenţei interne: Ca urmare a noii iteraţii. indicele Cronbach alfa se raportează doar cu două zecimale.702) dar care poate fi crescută prin eliminarea itemilor nepotriviţi. Se reia prelucrarea eliminându-se itemul i_02 din lista din caseta principală şi se obţine următoarea configuraţie de rezultate: Datele indică o valoarea Cronbach alfa de 0. o valoare care este modestă în raport cu nivelul minim necesar (0.75. fiind doar consumatoare de timp în aplicarea instrumentului.457. va fi eliminat. dacă privim ultima coloană de cifre.Pe ultima linie a imaginii găsim valoare lui Cronbach alfa. care anterior avea o corelaţie pozitivă dar extrem de mică. se şi observă că prin eliminarea acestui singur item. nu este recomandabilă eliminarea mai multor itemi simultan.

in ordine: • itemii care au o corelaţie negativă cu scorul global • itemii cu corelaţii mici. O scală „consistentă intern” ne oferă garanţia că itemii instrumentului nostru „merg împreună”.aceasta. consistenţa internă se va evalua separat pentru setul de întrebări corespunzător fiecărei sub-scale. prin studii de validare. măsoară acelaşi „construct” psihologic.33≈47 itemi. Este de la sine înţeles că.33 α x * (1 − α k ) . În concluzie. cu ocazia iteraţiilor succesive se vor elimina. Numărul itemilor necesari pentru a completa o scală care nu a atins valoarea acceptabilă a indicelui Cronbach alfa poate fi estimat cu ajutorul formulei SpearmanBrown: k= unde: αx este valoarea curentă a lui Cronbach alfa αk este nivelul dorit al lui Cronbach alfa k este factorul de multiplicare a scalei pentru a se obţine αk Într-un mod similar.70) Deci. acest lucru nu ne permite încă să afirmăm că măsoară exact ceea ce n-am propus să măsoare. ceea ce înseamnă că ne vor mai trebui 27 de itemi pe lângă cei 20 deja existenţi (estimare .70? k= α k * (1 − α x ) . însă. Această problemă va fi rezolvată ulterior.70 va trebui să avem o scală de 20*2. să atingem un nivel mai ridicat de consistenţă internă. în cazul în care construim un instrument ale cărui întrebări se adresează unor sub-scale diferite. nerelevante Cu cât avem mai mulţi itemi în această fază. Ca urmare. Atenţie.70 * (1 − . deci. Aşa cum concluziile studiilor statistice sunt mai sigure atunci când sunt efectuate pe eşantioane mai mari. acelaşi principiu se aplică şi în cazul construcţiilor scalelor: cu cît mai mulţi itemi cu atât mai bine pentru consistenţa scalei.63 - .50 Câţi itemi ar trebui adăugaţi pentru a atinge un nivel α de 0.50 * (1 − . pentru a atinge un α de 0. se poate estima valoarea lui Cronbach alfa (αk) care ar fi atinsă pornind de la un anumit nivel calculat al acestuia αx şi un anumit factor de multiplicare al numărului de itemi (k): α k * (1 − α x ) α x * (1 − α k ) αk = k *α x 1 + (( k − 1) * α x ) Exemplu: Avem o scală cu 20 de itemi şi αx=0. cu atât avem posibilitatea să păstrăm itemi care corelează mai intens cu scala şi. itemii rămaşi pot constitui o scală consistentă de evaluare a constructului psihologic pentru care au fost aleşi.50) = = 2.

De aceea este posibil ca rezultatul formulei să fie o estimare uşor optimistă dar nu mai puţin utilă. care nu este suficient de discriminativ pentru a fi păstrat. Mai departe.50 = = 0. analiza de itemi poate fi folositoare ca modalitate de identificare a itemilor greşit formulaţi.64 - . Chiar şi în acest tip de situaţii. itemi iniţiali+nr. .5 * .50) Desigur. pentru alt scop decât cel de selecţie sau evaluare comparativă între indivizi. în cazul în care răspunsurile la o anumită întrebare sunt corecte pentru cea mai mare parte a subiecţilor. itemi noi=(20+30)/20=2.5 − 1) * . sau pentru toţi. utilizarea indicelui Cronbach alfa nu este adecvată. se presupune că noii itemi adăugaţi vor fi la fel de „buni” ca şi cei deja utilizaţi. itemi noi)/nr. a celor nerelevanţi sau.71 1 + (( k − 1) * α x ) 1 + ((2. cu cât ar creşte α dacă am adăuga 30 de itemi: k=(nr. totuşi.valabilă pentru situaţia în care noii itemi ar avea aceeaşi corelaţie inter-itemi cu cei deja existenţi). Utilizarea improprie a analizei de itemi Atunci când o scală este utilizată pentru a măsura cunoştinţe asupra unui anumit subiect.5 αk = k *α x 2. pur şi simplu. O valoare redusă a acestuia nu poate însemna că itemii nu măsoară un anumit tip consistent de cunoştinţe (fapt incontestabil din moment ce fac parte dintr-un univers de cunoaştere bine definit) ci mai degrabă că subiecţii au răspuns la întâmplare. pentru a scoate în evidenţă erorile tipice pe care le fac subiecţii la anumite întrebări. avem de a face mai degrabă cu un item prea uşor. deşi am fi tentaţi să apreciem acest fapt ca o expresie pozitivă a „corelaţiei itemului cu scorul global”. Pentru acelaşi caz.

Teste neparametrice nominale Testul z al proporţiei pentru un singur eşantion Utilizare Testul z pentru proporţii pentru un eşantion. În cazul nostru. În cazul nostru. Procedura: Statistics-Non Patametric Tests-Binomial. Exemplu: La întrebarea „cine se uită la telenovele?” răspund DA 7 subiecţi.. Condiţii Cunoaşterea proporţiei la nivelul populaţiei pentru valorile variabilei testate. Variabilele de tip „string” nu sunt acceptate de procedura SPSS. valorile sunt 1 pentru feminin şi 2 pentru masculin. este utilizat în cazul variabilelor dihotomice pentru a testa diferenţa dintre proporţiile valorilor în eşantion prin comparaţie cu proporţia la nivelul populaţiei. Întrebarea cercetării este dacă femeile se uită într-o proporţie mai mare decât bărbaţii la telenovele.65 - . • Variabila testată este trecută în lista Test Variable List: . raportul femei/bărbaţi este cunoscut din studiile demografice (51%/49%) Aranjarea datelor Se creează variabila dihotomică cu valori numerice. dintre care 5 femei şi 2 bărbaţi..

prin fixarea unei valori care împarte distribuţia în două categorii.• • • În zona Define Dichotomy se alege Get from data. Rezultate Rezultatul în cazul exemplului dat cuprinde frecvenţa pe categorii. Proporţia femeilor care se uită la telenovele nu diferă semnificativ de proporţia bărbaţilor. prin raportare la proporţia lor în populaţie.243). sau Cut point. Butonul Options permite solicitarea statisticii descriptive pentru variabila testată. .66 - . dacă variabila este continuă. În acest caz. În zona Test proportion se introduce proporţia primei categorii. procentul şi semnificaţia testului în raport cu proporţia la nivelul populaţiei (p=0. se acceptă ipoteza de nul şi se respinge ipoteza cercetării. dacă variabila este dihotomică.

. conţine semnul diferenţei. prin clic de mouse pe fiecare. În prima fază. utilizându-se semnul diferenţei şi nu valoarea acesteia. pentru a se putea face diferenţa lor. Ambele sunt prezentate numai pentru a face mai evident baza de calcul a testului deoarece.. Dat fiind faptul că numărul subiecţilor este prea mic pentru asumarea normalităţii distribuţiei de eşantionare. Exemplu: Într-un experiment cu privire la efectul motivării asupra memorării. Acest fapt se observă în partea de jos a casetei. în locul testului t pentru eşantioane dependente. care vor fi analizate. cu atât creşte posibilitatea ca diferenţa dintre variabile să fie statistic semnificativă. atunci când ambele valori sunt măsurate pentru aceiaşi subiecţi . Procedura: Statisstics-Nonparametric Tests-2 Related Samples. 2. atunci numărul diferenţelor pozitive ar trebui să fie egal cu cel al diferenţelor negative. pe baza formulei 4. Cu cât numărul diferenţelor de un anumit semn este mai mare comparativ cu cel al diferenţelor de semn opus. se pot testa simultan mai . subiecţilor li se cere să memoreze cuvinte dintr-o listă.Testul semnelor Utilizare Testul semnelor este utilizat pentru a testa diferenţa dintre valori. nu sunt relevante sub aspectul procedurii SPSS. Dacă nu se dispune de valorile variabilelor ci numai de semnul diferenţei. în fapt. Variabila „semn”. perechea de variabile este trecută în lista Test Pair(s) List: prin acţionarea butonului ►. Variabila „dif” conţine rezultatul diferenţei „dupa-inainte”. constituindu-se în pereche. se alege testul semnului.7. înainte si după introducerea unui factor motivant. iar valorile exprimate în aceeaşi unitate de măsură. în Apoi. cele două variabile sunt selectate. Condiţii Variabilele vor fi de tip numeric. Dacă este necesar. Aranjarea datelor Imaginea de mai jos conţine variabilele „inainte” şi „dupa”. Dacă nu ar exista nici o diferenţă între valorile perechi.67 - . testul semnului va fi calculat manual. pe rând.

. este 0.016).05. Ipoteza de nul se respinge dacă valoarea lui p este mai mică decât pragul fixat şi care. respectiv negative. multe perechi de variabile. Rezultate Tabelul Sign Test cuprinde numărul diferenţelor pozitive.zona Current Selections. În exemplul dat. acceptându-se ipoteza cercetării (motivarea stimulează memorarea). implicit. Se bifează Sign în zona Test Type. prezintă semnificaţia testului (p=0. pentru cazurile din baza de date. Tabelul Test Statistics.68 - . În cazul nostru. există 7 diferenţe pozitive şi nici o diferenţă negativă. ipoteza de nul se respinge.

cel puţin. Nici o celulă nu trebuie să aibă frecvenţa aşteptată 0. Sub forma unor înregistrări distincte pentru fiecare caz Acest mod poate fi extrem de dezavantajos atunci când sunt multe cazuri sau când există deja o statistică globală a fenomenului PTSD în raport cu sexul. afectat de un cutremur de pământ. iar datele sunt cele din următorul tabel de corespondenţă: PTSD Non-PTSD sex. Este recomandabil ca frecvenţa aşteptată să nu ia valori mai mici de 5 (sau.69 - . Sub forma unor înregistrări distincte pentru valorile caracteristicii de sex: . b. Femei 20 30 Bărbaţi 10 40 Problema cercetării este dacă incidenţa PTSD este în legătură cu caracteristica de Aranjarea datelor Datele pot fi incluse în Data Editor în două moduri: a.. în nu mai mult de 20% din celule). Exemplu: Să presupunem că am evaluat numărul femeilor şi al bărbaţilor diagnosticaţi cu sindrom de stres postraumatic (PTSD) dintr-un mic oraş.Testul Chi-pătrat al asocierii (independeţei) Utilizare Testul chi-pătrat este utilizat pentru evidenţierea gradului de asociere între două variabile categoriale. Condiţii • Cele două variabile nu trebuie să se „intersecteze” (să nu existe subiecţi care să • • fie incluşi în mai mult de o celulă de tabel).

În această situaţie. Percentages-Row. Procedura: Statistics-Summarize-Crosstabs.. Faptul că în celule apar etichetele şi nu valorile.70 - . atât pentru sex cât şi pentru PTSD. se introduc frecvenţele PTSD pentru toate combinaţiile valorilor celor două variabile analizate şi frecvenţele asociate fiecăreia. Casetele de configurare sunt următoarele: • • • În caseta principală Crosstabs se trec variabilele analizate în lista Row(s).  Procedura Chi-pătrat acceptă şi variabile de tip caracter (string) dar reamintim recomandarea de principiu ca toate variabilele să fie declarate de tip numeric. Pot fi analizate mai multe perechi de variabile simultan. respectiv Columns(s). valorile fiind etichetate. Total şi Residuals-Unstandardized (bifarea opţiunilor este în funcţie de informaţiile pe care le doreşte analistul). se va bifa şi Display clustered bar charts. În caseta Cell Display se bifează Counts-Observed.. se apelează la procedura Data-Wheight Cases. Column. .: Facem precizarea că în tabelele de date din imaginile de mai sus variabilele au fost codificate numeric cu 1 respectiv 2... se obţine prin setarea DataValue Labels. Rezultatul analizei nu depinde de modul de plasare a variabilelor pe linie sau pe coloană. Dacă de doreşte crearea unui grafic al corespondenţei dintre variabile. Pentru a se realiza corespondenţa dintre variabilele sex şi PTSD cu variabila frecv. În caseta Statistics se bifează Chi-Square.

unde tabelul de corespondenţă este format din două linii şi două coloane.05. în special. pragul de semnificaţie al acestuia (p=0.001). +10) În tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16. valoarea lui chi-pătrat poate fi luată de pe linia Continuitiy Correction (15.71 - . În cazul particular al acestui exemplu.04) cu valoarea aferentă a pragului de semnificaţie: p<0.  În raportarea statisticii chi-pătrat va fi inclusă valoarea gradelor de libertate (df) şi numărul cazurilor  Valoarea lui chi-pătrat se raportează cu două zecimale . având pe linii valorile caracteristicii de sex iar pe coloane valorile aferente variabilei PTSD.001. Valoarea testului chi-pătrat fiind mai mică decât nivelul alfa 0. Vom exemplifica pentru celula „feminin/da”: • Count 20 indică numărul femeilor cu PTSD • %within Sex 40.0% indică procentul femeilor care au manifestat PTSD din totalul femeilor • %within PTSD indică procentul femeilor cu PTSD din totalul celor care au manifestat PTSD • % of Total indică procentul femeilor cu PTSD din totalul subiecţilor • Residual indică diferenţa dintre numărul de femei cu PTSD (frecvenţa observată) şi frecvenţa aşteptată (în cazul nostru.000 care va fi citit ca p<0.Rezultate Imaginea prezintă tabelul de corespondenţă.66) şi. În celulele tabelului se află valorile solicitate prin configurarea casetelor. se respinge ipoteza de nul şi se confirmă ipoteza cercetării: există o incidenţă mai mare a reacţiei de stres postraumatic la femei decât la bărbaţi.

.72 - . ca în exemplul anterior. Exemplul 1: Avem evaluarea nivelului de inteligenţă pe cinci categorii valorice. la foarte bun şi dorim să ştim dacă distribuţia acestor calificative se supune curbei normale.: .33%). fie. Exemplul 2: Am solicitat unui grup de tineri să îşi exprime genul muzical preferat şi am obţinut frecvenţe diferite pentru mai multe genuri de muzică. dacă nu ar fi semnificative proporţiile preferinţelor pentru genurilor muzicale. 14%. Problema este dacă diferenţele dintre aceste frecvenţe sunt semnificative. de la foarte slab. Aranjarea datelor Vom exemplifica pe o situaţie corespunzătoare celui de-al doilea exemplu. dinainte cunoscute..5%. presupunând că.5%). prin înregistrarea rezultatelor sintetice şi ponderarea variabilei gen_muz cu variabila frecv prin operaţia Data-Weight cases. 14%. fiecare ar trebui să întrunească un procent de 33. Baza de date se poate constitui fie prin înregistrarea fiecărui caz în parte (având o variabilă pentru genul muzical şi o alta pentru exprimarea preferinţei faţă de acesta). procentele aferente pe curba normală fiind cunoscute (2. 67%. ar trebui să fie identice (adică. 2. dacă ar fi trei genuri. Testul Chi-pătrat pentru corespondenţă (goodness of fit) Utilizare Testul chi-pătrat pentru gradul de corespondenţă se utilizează atunci când dorim să comparăm frecvenţele observate unei singure variabile categoriale cu frecvenţele aşteptate.Graficul de tip bară permite vizualizarea relaţiei dintre variabile.

Procedura: Statstics-NonParametric-Tests-Chi-Square. am fi introdus pe rând acele frecvenţe (scriindu-le în dreptul lui Values şi înregistrându-le prin butonul Add) Rezultate Cele două tabele cu rezultate din Viewer prezintă: • Frecvenţele observate.002 Acest rezultat justifică respingerea ipotezei de nul şi acceptarea concluziei că subiecţii diferenţele dintre preferinţele pentru cele trei genuri muzicale sunt semnificative şi nu se datorează variaţiei întâmplătoare de eşantionare.. acesta fiind modelul în raport cu care dorim să testăm frecvenţele variabilei analizate Dacă am fi dorit să le testăm în raport cu alte frecvenţe cunoscute. • • • În caseta Chi-Square Test se trece variabila analizată în zona Test Variable List. am fi bifat Values şi. .. frecvenţele aşteptate şi valorile reziduale (diferenţa dintre frecvenţe) pentru cele trei genuri muzicale • Valoarea testului Chi-pătrat al corespondenţei (12. Se bifează All categories equal.17). apoi.73 - . df(2) şi p=0.

existând o variabilă pentru opinia faţă de fenomenele paranormale şi una pentru tipul de instituţie de învăţământ. care presupune o prealabilă sintetizare a datelor: • • • o variabilă (paranorm) pentru codificare „credinţei” în fenomenele paranormale.74 - . fie ca în imaginea de mai jos. devenite „invizibile”. o variabilă (stud_la) pentru apartenenţa la una din cele două instituţii de învăţământ superior. SPSS va opera în calcule cu valorile. 3 Datele nu sunt reale .  Este important de reţinut că toate variabilele trebuie să fie numerice. o variabilă (frecv) pentru frecvenţa cazurilor.  Valorile variabilelor au fost etichetate corespunzător iar afişarea etichetelor în locul valorilor. deşi afişează etichetele. În acest scop se utilizează o procedura Crosstabs şi testul chi-pătrat. efectuat în rândul studenţilor de la Universitate comparativ cu studenţii de la Politehnică. se înregistrează următoarele rezultate3: • La psihologie: 25 studenţi „nu cred” în fenomenele paranormale iar 175 „cred” • La politehnică: 124 „nu cred” în fenomenele paranormale iar 32 „cred” Problema cercetării este dacă diferenţa dintre cei „cred” în fenomenele paranormale din cele două categorii de studenţi este semnificativă. În baza de date de mai sus. Exemplu: În urma unui studiu comparativ cu privire la interesul faţă de fenomenele paranormale. Procedura: SPSS nu dispune de o procedură specifică pentru calcularea directă a diferenţei dintre două procente. iar variabila stud_la are valoare 1 pentru Universitate şi 2 pentru Politehnică. a fost obţinută cu setarea View-Value labels din meniul SPSS Data Editor.Testul z al diferenţei dintre două proporţii independente Utilizare Acest test se utilizează atunci când se doreşte compararea a două proporţii obţinute pentru o variabilă dihotomică. De reţinut că. în celulele tabelului de date. variabila paranorm aia valoarea 1 pentru „cred” şi valoarea 2 pentru „nu cred”. Aranjarea datelor Datele pot fi introduse fie caz cu caz.

care contorizează numărul cazurilor. cu valorile variabilei ponderate prin procedura Wheight.. acestea fiind identice cu cele de la testul chi-pătrat). Includerea variabilei ponderate în diverse proceduri de analiză are efecte specifice. operaţia Wheight nu ar mai fi fost necesară. 2. În prealabil.75 - .  Dacă datele ar fi fost introduse în baza de date caz cu caz. Efectul ei este unul „invizibil” pe ecran dar se va vedea în analizele statistice ulterioare. se execută procedura Weight pentru variabilele categoriale (paranorm şi stud_la) în funcţie de variabila frecv. La salvarea fişierului se salvează şi variabila ponderată.  Efectul de ponderare (wheight) a unei variabile rămâne activ atâta timp cât nu se ponderează o altă variabilă sau nu se anulează ponderarea efectuată. Operaţia asociază valorile variabilelor categoriale (paranorm şi stud_la) cu valorile variabile frecv.. Se execută procedura Statistics-Summarize-Crosstabs. Rezultate SPSS Viewer prezintă mai întâi tabelul de corespondenţă dintre variabilele categoriale. . pentru variabilele paranorm şi stud_la. (nu mai prezentăm imaginile. cu selectarea Chi-Square din caseta Statistics.

. În cazul nostru. astfel: 175 32 p a − pb = − = 0.598 = 12.76 - .598).71) este mai mare decât z critic (1.71 Semnul lui z se află din diferenţa proporţiilor testate. z calculat (12.875 − 0.05. pentru test unilateral sau bilateral. fapt care permite respingerea ipotezei de nul şi confirmarea ipotezei că studenţii de la Universitate „cred” într-o măsură semnificativ mai mare în fenomenele paranormale decât studenţii de la Politehnică.96).67 200 156 Decizia statistică se ia prin raportarea valorii calculate a lui z la valorile critice ale acestuia de pe curba normală.205 = 0.Din tabelul Chi-Square Tests citim valoarea Pearson Chi-Square (161. Testul z pentru diferenţa proporţiilor se calculează ca radical din valoarea lui chipătrat: z = 161. pentru test bilateral cu alfa=0.

Acelaşi chestionar a fost aplicat din nou.Teste neparametrice pentru date ordinale Testul Mann-Whitney (U) pentru două eşantioane independente Utilizare Testul Mann-Whitney este utilizat pentru testarea diferenţei dintre grupuri independente pentru care variabila dependentă este exprimată în valori ordinale (de rang) sau atunci când. chiar dacă este de tip cantitativ. 2=Alcool) • depr_1. în prima fază. ea nu trebuie să lipsească din nici o baza de date) • drog. În acest scop vor trebui comparate valorile la depresie ale celor două grupuri. pentru tipul de drog utilizat (sunt afişate etichetele. scorul la depresie la a doua evaluare  Variabilele dependente din exemplul nostru au valori măsurate pe scală cantitativă. acela de a verifica ipoteza că cele două tipuri de drog (Ecsatsy şi alcool) au efecte depresante diferite. un cod numeric de identificare a fiecărui subiect (deşi exemplele anterioare nu au cuprins această variabilă. scorul la depresie la prima evaluare • depr_2. Aranjarea datelor Variabilele din baza de date sunt următoarele: • cod_sub.77 - . Obiectivul studiului este. nu suportă un test parametric (testul t). Această analiză va fi efectuată atât pentru valorile depresiei de la prima măsurare cât şi pentru cele de la a doua evaluare a depresiei. Apoi i-a convins să ia parte la un experiment şi le-a administrat un chestionar de evaluare a depresiei. Exemplu: La ieşirea dintr-un club de noapte. iar valorile sunt 1=Ecstasy. un psiholog interesat de efectul depresiv al drogurilor a efectuat interviuri în legătură cu acest aspect şi a identificat un număr de 10 tineri care au consumat câte o pastilă de Ecstasy şi un număr de 10 tineri care au consumat doar alcool. peste trei zile. Testarea lor cu un test ordinal nu presupune o prealabilă transformare de .

78 - . depresia imediată şi remanentă. se observă depresia imediată nu diferă semnificativ în funcţie de tipul de drog utilizat. Procedura se aplică în acelaşi mod şi direct pe valori ordinale de rang.. În caseta Two-Independent Samples Tests variabilele analizate sunt trecute în lista Test Variable List. având în vedere volumul foarte mic al eşantionului. Cu toate acestea. utilizarea unui test neparametric este de preferat. media rangurilor şi suma rangurilor. În cazul nostru. Se cuvine să precizăm că. .rang. Rezultate Tabelul Ranks oferă informaţii sintetice despre cele două variabile: volumul grupurilor. Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele două variabile testate simultan. Valorile de interes din tabel sunt cele ale lui Z şi nivelul de încredere p. datele de acest tip ar conduce la utilizarea testului t pentru eşantioane independente. Procedura: Statistics-Non Parametric Tests-2 Independent Samples.. programul efectuând automat această transformare. în mod normal. în timp ce depresia remanentă este semnificativ diferită. mai mare la utilizatorii de Ecstasy decât la utilizatorii de alcool (conform datelor din tabelul anterior).

Se acţionează butonul ► pentru a se variabilă. Se selectează prin clic de mouse fiecare 2. psihologul a testat într-o primă fază semnificaţia diferenţei dintre cele două grupuri definite prin tipul de drog diferit (eşantioane independente). separat. Setarea procedurii în caseta Two-Related-Samples tests se face în doi timpi: 1. însă. pe fiecare grup identificat prin valorile variabilei. aceea de a declara împărţirea bazei de date în funcţie de grupurile definite prin tipul de drog. există două soluţii. tipul de drog) prin trecerea ei în zona Groups Based on:.. În acest scop se va utiliza procedura Data-Split File. se va avea în vedere revenirea la setarea Analyze all cases. De aceea.  Procedura: Statistics-Non Parametric Tests-2 Related Samples. În locul setării implicite Analyze all cases. deoarece analiza trebuie efectuată separat pe grupurile de consum Ecstasy/Alcool. În acest caz. Aranjarea datelor Este identică cu cea prezentată pentru testul Mann-Whitney. apoi selectarea celui de-al doilea grup şi efectuarea testului. Una dintre problemele cercetării este şi aceea dacă există o diferenţă între nivelul depresiei imediate şi cel al depresiei remanente.. atunci când se revine la prelucrări care ar trebui să implice toată baza de date rezultatele vor fi incorecte. Operaţiunea de împărţire a bazei de date nu are semne vizibile. fapt care poate face să fie uitată şi. Efectul acestei acţiuni este acela că toate prelucrările care vor fi efectuate din acest moment se vor aplica. Acest tip de analiză nu se poate face decât pentru subiecţii aparţinând aceluiaşi tip de drog utilizat. constituindu-se perechea supusă transfera perechea de variabile în zona Test analizei Pair(s) list. ... se bifează opţiunea Compare groups şi se declară variabila ale cărei valori vor servi drept criteriu de împărţire a bazei de date în grupuri de analiză separată (în cazul nostru.Testul Wilcoxon pentru două eşantioane perechi Utilizare În exemplul de mai sus.79 - . do not create groups. astfel. O soluţie mai elegantă este. Prima ar fi selectarea (cu Data-Select Cases) a primului grup şi efectuarea testului. do not create groups atunci prelucrarea pe grupuri a bazei de date nu mai este becesară.

media rangurilor şi suma lor. comparativ cu alcoolul.053). diferenţa este semnificativă (p=0. Concluzia generală a studiului este aceea că Ecstasy. numărul subiecţilor. Aşa cum se observă. .Se bifează opţiunea pentru testul Wilkoxon (care este. Tabelul Test Statistics prezintă valorile comparative ale depresiei pentru cele două grupuri.80 - . are un efect depresant mai mare (testul Mann-Whitney) şi mai accentuat cu trecerea timpului (testul Wilcoxon).007) în cazul consumatorilor de Ecstasy şi nesemnificativă (p=0. în cazul consumatorilor de alcool. cea implicită) Rezultate Tabelul Ranks oferă informaţii sintetice despre rangurile pozitive şi negative pentru cele două grupuri. de fapt.

Acest test pentru date ordinale este analog testului ANOVA pentru date cantitative..81 - . Rezultatele vor fi identice dacă variabila dependentă este exprimată şi direct în valori de rang. Etichetele sunt afişate ca urmare a opţiunii Data-Value Labels... 2=mamă singură. Exemplu: A fost studiate relaţia dintre condiţiile familiale (familie armonioasă.k Independent Samples. mamă singură. variabila familie a fost codificată şi etichetate astfel: 1=familie armonioasă.. Se activează comanda Define Range. măsurată pentru mai mult de două grupuri independente (formate din subiecţi diferiţi). şi dorim să testăm diferenţa dintre acestea. maxim 3. familie conflictuală) şi frecvenţa reacţiilor emoţionale pozitive la copiii de vârstă preşcolară. În caseta principală se trece variabila testată în zona Test Variable List: iar variabila independentă în zona Gouping Variable. Problema cercetării este dacă diferenţele sunt semnificative iar mediul familial are legătură conduita emoţională a copiilor. Testul Kruskal-Wallis este bifat implicit. 3=familie conflictuală. Forma finală a casetei este aceasta. . Se defineşte domeniul valorilor variabilei independente. Aranjarea datelor În baza de date. pe durata unei săptămâni.Testul Kruskal-Wallis pentru mai mult de două eşantioane independente Utilizare Testul Kruskal-Wallis este utilizat atunci când avem o variabilă dependentă ordinală. Procedura: Statistics-Non Parametric tests. în cazul nostru: minim 1.

Ca urmare.33) cu două grade de libertate şi p=0. De precizat că programul acordă rangul 1valorii celei mai mici. afişat în tabelul Test Statistics.82 - . ipoteza de nul poate fi respinsă. Rezultatul testului. Datele confirmă ipoteza că mediul familial (exprimat prin cele trei tipuri de familie) îşi pune amprenta asupra expresivităţii emoţionale a copiilor de vârstă preşcolară. . se exprimă printr-o valoare chipătrat (6.Rezultate Primul tabel include informaţii descriptive cu privire la variabila testată: numărul subiecţilor din fiecare grup şi media rangurilor pentru fiecare grup.042. Datele din tabel indică descreşterea mediei rangurilor (expresii emoţionale pozitive numeroase) de la familia armonioasă la cea conflictuală.

rezultatul său este echivalent cu al testului Wilcoxon. pentru date cantitative. El este echivalentul testului ANOVA pentru măsurări repetate. prezentat mai sus. Se setează opţiunea Friedman iar variabilele testate sunt trecute în lista Test Variables: .83 - . 3000m şi 6000m. deoarece acest lucru va fi efectuat automat de program.. Capacitatea de memorare de cuvinte este măsurată la trei înălţimi diferite: 1000m. Aranjarea datelor Variabilele mem_1000. Procedura: Statistics-Non Parametric Tests-K related Samples. efectuarea unui test parametric (ANOVA RM) ar fi nesigură iar apelul le testul Friedman este pe deplin justificat. ele vor fi introduse ca atare.Testul Friedman pentru măsurări repetate Utilizare Testul Friedman se utilizează pentru testarea diferenţei de rang în cazul unei variabile măsurate repetat. Exemplu: Efectele altitudinii asupra memoriei sunt testate pe un grup de alpinişti. de mai mult de două ori. mem_3000 şi mem_6000 conţin numărul cuvintelor memorate pentru fiecare dintre cei 5 alpinişti. pe acelaşi grup de subiecţi. Dacă este utilizat pentru doar două măsurări repetate. rezultatul fiind identic. Problema cercetării este dacă diferenţa de performanţă de memorare corespunzătoare celor trei înălţimi este semnificativă.. Dat fiind volumul extrem de mic am eşantionului (N=5). Nu este necesară transformarea lor în valori de rang. Dacă datele primare sunt sub formă de ranguri.

la aceleaşi înălţimi descrise mai sus. Problema cercetării este dacă între performanţa de memorare şi ce de timp de decizie este o relaţie (variaţie concomitentă) semnificativă.Rezultate Primul tabel prezintă media rangurilor pe înălţimi (rangul 1 este atribuit valorii celei mai mici). avem acum şi variabilele pentru timpul de decizie. Aranjarea datelor ] Alături de variabilele „memorie” pentru cele trei înălţimi.40). având un nivel de semnificaţie p=0. Procedura: Statistics-Corelation-Bivariate . care au efectuat. Coeficientul de corelaţie pentru date ordinale (Spearman) Utilizare Testul de corelaţie a rangurilor (Spearman) este echivalentul pentru date ordinale testului de corelaţie Pearson. Acest rezultat permite respingerea ipotezei de nul şi confirmă ipoteza că memoria cuvintelor este în legătură cu înălţimea (pe cele trei niveluri avute în vedere). şi un test de viteză de decizie (măsurată în zecimi de secundă). Exemplu: Să luăm în considerare studiul aceluiaşi grup de alpinişti.84 - .015. Rezultatul său variază pe aceeaşi plajă de valori (-1/+1) şi se interpretează în mod similar cu rezultatul testului Pearson. În al doilea tabel găsim valoarea testului Friedman exprimată în valori chipătrat (8.

În fiecare celulă a matricii se vor afla. aşa cum am spus. În practică. am îngroşat . în realitate nu vom utiliza decât unul dintre aceşti coeficienţi de corelaţie a rangurilor. prezentată anterior la corelaţia Pearson: Se acţionează butonul Paste care deschide fereastra Syntax. se va utiliza doar unul dintre acestea două). Această variantă de lucru nu este obligatorie. care este echivalent lui Spearman. Pentru a fi mai vizibile. doar pentru a le putea compara. aşa cum vom vedea. Din celulele tabelului de mai sus nu ne interesează decât cele care cuprind corelaţia dintre memorie şi decizie la acelaşi palier de înălţime.Variabilele supuse testului de corelaţie se trec în lista Variables: Se anulează setarea pentru testul Pearson şi se bifează Spearman (aici am ales şi testul Kendal tau-b. mai multe numere. Pentru a obţine un format mai convenabil de prezentare a rezultatelor. Aici se introduce clauza WITH între primul grup de variabile (memorie) şi al doilea grup de variabile (decizie): Mai departe. unde găsim comenzile procedurii. recomandăm o procedură suplimentară. variabilele „decizie”. procedura de corelaţie se lansează cu butonul ► de pe bara de comenzi a ferestrei Syntax. Deoarece am cerut calcularea simultană a ambilor coeficienţi de corelaţie. Se poate efectua corelaţia şi direct din caseta principală. Această configurare a casetei de dialog produce o matrice de corelaţii cu şase linii şi şase coloane pentru fiecare dintre cele două teste alese.85 - . dar. Din acest motiv citirea ei nu este tocmai comodă. datele sunt dublate. Este de la sine înţeles că. Rezultate Tabelul cu rezultate cuprinde pe linii variabilele „memorie” şi pe coloane. rezultatele vor fi prezentate într-o formă mai puţin „ergonomică”.

Testul Kendall al corelaţiei dintre memorie şi decizie la 1000 de metri are valoarea -0.023. semnificaţiile se află. semnificativ la p=0. timpul de decizie fiind mai mare).05) între memorie şi decizie la toate palierele de înălţime. Analiza coeficienţilor din tabelul de mai sus arată existenţa unei corelaţii de rang semnificative (p<0.94. înseamnă o capacitate de memorare mai bună iar valori mari ale timpului de decizie înseamnă capacitate de decizie mai proastă (sub aspectul vitezei. avem corelaţiile pentru testul Kendall iar în jumătatea de jos pe cele ale testului Spearman. Utilizarea unuia sau altuia dintre cei doi coeficienţi rămâne la latitudinea cercetătorului. desigur). şi decizia este mai lentă. o variaţie concomitentă pozitivă a memoriei şi vitezei deciziei (când capacitatea de memorare scade. simultan. În jumătatea de sus a tabelului. La interpretarea coeficienţilor de corelaţie este extrem de important să se ia în considerare. de fapt. . valori mari ale memoriei. În cazul nostru.86 - . de aceeaşi parte a deciziei statistice (respingerea ipotezei de nul). semnul şi semnificaţia variaţiei valorilor.valorile utile analizei. un coeficient de corelaţie negativ între aceste variabile indică. vom vedea că. În consecinţă. Dacă facem comparaţia dintre coeficienţii Spearman şi Kendal. în toate cazurile. deşi ei diferă valoric.