SCOPUL UNITĂŢII DE CURS ▪ oferă noţiuni, explicaţii şi aplicaţii pentru a înţelege şi opera eficient cu programul SPSS 10.

0 în scopul prelucrării statistice a datelor. OBIECTIVE OPERAŢIONALE În urma studierii acestei unităţi de curs, studenţii: ▪ vor putea să definească variabilele şi să conceapă o bază de date adecvată; ▪ vor redefini şi transforma variabile; ▪ vor prelucra datele statistice la nivel descriptiv; ▪ vor realiza analiza corelaţională a datelor şi vor interpreta rezultatele obţinute; ▪ vor folosi testul t pentru compararea unui eşantion cu o populaţie şi a două eşantioane (perechi sau independente) şi vor interpreta rezultatele obţinute; ▪ vor utiliza analiza de varianţă pentru analiza efectului unui singur factor şi vor interpreta rezultatele obţinute; ▪ vor utiliza analiza de varianţă pentru analiza efectelor de interacţiune; ▪ vor utiliza metode non-parametrice de analiză a datelor. EVALUARE ▪ 40% din nota finală examen practic care presupune prelucrarea şi interpretarea datelor; ▪ 60% din nota finală evaluările de pe parcursul seminariilor, care vor presupune prelucrări şi analize statistice ale datelor.

OBSERVAŢIE !!! Cursul nu epuizează opţiunile programului SPSS şi nu suplineşte lipsa informaţiilor statistice teoretice.

ANALIZA COMPUTERIZATĂ A DATELOR

I. FAMILIARIZAREA CU PROGRAMUL SPSS 10.0
I.1. TIPURI DE VARIABILE. DIFERENŢA DINTRE VARIABILE, VALORI ŞI SCORURI Variabile sunt definite ca proprietăţi ale fenomenelor, obiectelor sau proceselor, care pot lua diferite valori. Există mai multe criterii în funcţie de care se pot clasifica variabilele: după natura măsurii variabilele pot fi: cantitative (variază cantitativ, cum ar fi de exemplu greutatea sau vârsta subiecţilor) sau calitative (sunt cele care variază calitativ, cum ar fi genul sau etnia subiecţilor); după felul variaţiei, variabilele pot fi: continui (teoretic pot lua orice valoarea, între două valori ale variabilei putând să apară o a treia valoare; vârsta subiecţilor este un exemplu de variabilă continuă) sau discrete (pot avea numai anumite valori, între care nu mai apar altele; religia, tipurile temperamentale sunt exemple de variabile discontinui); după scopul folosirii lor în studii experimentale: independente (sunt variabilele manipulate de experimentator şi care se presupune că influenţează variabila dependentă) sau dependente (reprezintă răspunsurile subiecţilor). O variabilă poate lua diferite valori. Valoarea reprezintă o măsură calitativă sau cantitativă a unui fenomen. Spre exemplu, pentru variabila “nota şcolară” valorile acesteia sunt toate notele de la 1 la 10. Pentru variabila “zilele săptămânii” valorile sunt toate cele şapte zile ale săptămânii. În psihologie se face distincţia între valori şi scoruri. Scorul este valoarea obţinută de o persoană, fenomen sau obiect atunci când ne referim la o anume variabilă. Spre exemplu, nota pe care o obţine un elev la o materie (să zicem 7) reprezintă scorul subiectului la variabila “nota şcolară”. I.2. PREZENTAREA APLICAŢIEI SPSS SPSS (în traducere Pachet statistic pentru ştiinţele sociale) este numele unui pachet de programe care ajută la analiza datelor obţinute în cercetările din domeniul ştiinţelor sociale. Deschiderea programului se poate face cu ajutorul mouse-ului, cu dublu-click asupra pictogramei programului de pe desktop. Aplicaţia mai poate fi deschisă de la butonul START/PROGRAME, opţiunea SPSS FOR WINDOWS, ca în imaginea de mai jos:

Oricare ar fi metoda de deschidere a programului, pe ecran va apărea următoarea fereastră:

251

LOREDANA GHERASIM

Prima bară din partea de sus a ferestrei oferă informaţii despre denumirea aplicaţiei şi numele fişierului cu care se lucrează. Urmează bara de meniuri a programului şi cea cu butoane. Foia cu date este organizată tabelar. Întotdeauna coloanele tabelului reprezintă variabilele studiului, în timp ce liniile, rândurile numerotate ale tabelului reprezintă subiecţii cercetării. În partea de jos a ferestrei sunt două opţiuni: DATA VIEW şi VARIABLE VIEW. Putem vizualiza datele brute ale subiecţilor, dacă este activă opţiunea DATA VIEW sau putem vizualiza descrierea variabilelor introduse în baza de date, dacă este activată opţiunea VARIABLE VIEW. De obicei, atunci când deschidem programul, este activă opţiunea DATA VIEW, cum se poate observa şi în imaginea de mai sus. Printr-un simplu click stânga pe opţiunea VARIABLE VIEW, pe ecran apare un alt tabel care permite definirea variabilelor din baza de date: Din meniul FILE putem alege comanda deschidere a unei noi baze de date (opţiunea NEW DATA) sau a unei noi foi de rezultate (NEW OUTPUT): Acest program prezintă rezultatele prelucrărilor statistice într-o pagină separată, numită OUTPUT. Comenzile care sunt colorate în gri sunt comenzi inactive pentru că baza de date nu conţine, deocamdată, nici o informaţie. Din acest meniu putem deschide, folosind opţiunea OPEN, o bază de date care a fost creată anterior (DATA) sau un fişier cu rezultatele prelucrărilor statistice anteriore (OUTPUT).

252

CUT şi PASTE sunt folosite pentru copierea sau mutarea datelor din celule. În această bază de date avem pe coloană variabile (ca de exemplu. DESCHIDEREA UNEI BAZE DE DATE Pentru deschiderea unei baze de date create anterior se activează meniul FILE/OPEN opţiunea DATA. În momentul încărcării bazei de date pe ecran va apărea următoarea imagine: Valorile din baza de date reprezintă răspunsurile brute ale subiecţilor. guv. rânduri sau coloane. subiectul de pe rândul 9 are valoare 3 la variabila gr_mult. plasarea cursorului în noua locaţie şi apoi activarea comenzii PASTE. viitor. comanda SAVE AS permite salvarea unui fişier modificându-i numele.3. I. Rândurile conţin răspunsurile subiecţilor la diferiţi itemi. parlam). Pe coloane sunt definite variabilele. fişierele cu baze de date au întotdeauna extensia sav) care se găseşte la adresa C:\MY DOCUMENTS\EXEMPLE SPSS. comenzile COPY. 4 la variabila viitor etc. Opţiunile RECENTLY USED DATA şi RECENTLY USED FILES deschid bazele de date şi foile cu rezultate recent create sau utilizate în programul SPSS.sav (în aplicaţia SPSS. Din meniul EDIT. Copierea sau mutarea datelor presupune selectarea datelor. Pentru a vedea ce înseamnă fiecare dintre aceste variabile trebuie activată opţiunea VARIABLE VIEW: 253 . activarea comenzii COPY/CUT din meniul EDIT. valoarea 3 la variabila prezent. Vom deschide fişierul opinii. gr_mult. directie. De exemplu. valorile numerice din fiecare coloană reprezentând scorurile subiecţilor la aceste variabile. prezent. După activarea comenzii pe ecran apare o casetă de dialog care permite selectarea directorului şi respectiv fişierului care conţine baza de date.ANALIZA COMPUTERIZATĂ A DATELOR Comanda SAVE permite salvarea obişnuită a fişierului cu date sau cu rezultate.

Definirea variabilelor presupune activarea câmpului VARIABLE VIEW.4. trebuie plasat cursorul în celula în care este trecut numele (NAME) generic al variabilei (var0001). cu 20 de caractere la partea întreaga şi 0 zecimale. De exemplu. fără spaţiu sau semne de punctuaţie. Pentru a defini o variabilă. Rezultatul va fi următorul: Numele variabilei poate să cuprindă maxim opt caractere. Baza de date va conţine patru variabile: numărul subiecţilor (nrsub). Pentru introducerea datelor se plasează cursorul în celulă şi se introduce valoarea cu ajutorul tastelor. Vom crea o baza de date care să conţină rezultatele la anxietate obţinute de un număr de subiecţi. La fel se vor introduce şi celelalte valori ale primei variabile. La studiu au participat subiecţi de gen feminin şi masculin. CREAREA UNEI NOI BAZE DE DATE Pentru a crea o nouă bază de date trebuie activată opţiunea DATA VIEW. coloanele reprezentând diferite caracteristici ale variabilelor. prin executarea unui dublu click pe numele variabilei (în cazul nostru var0001) sau prin activarea butonului VARIABLE VIEW din partea de jos a câmpului. Această opţiune poate fi activată cu ajutorul mouse-ului cu un click stânga pe butonul gri din celula corespunzătoare variabilei. vom introduce prima valoare (1) a primei variabile. După introducerea primei valori automat programul a denumit prima variabilă (var0001). I. Spre exemplificare. iar indicativul primei linii devine activ. înainte şi după intervenţia terapeutică (anxietatea a fost măsurată cu ajutorul unei scale de anxietate). Pentru a utiliza cu uşurinţă datele este indicată definirea sau redenumirea variabilelor cu care lucrăm. reprezentând itemul „Cât de mulţumit sunteţi în general de felul în care trăiţi?”. variabila gr_mult este o variabilă de tip numeric. nivelul anxietăţii subiecţilor înaintea terapiei (ANX1) şi nivelul anxietăţii subiecţilor după terapie (ANX2) şi genul subiecţilor (1-subiecţi de gen masculin şi 2-subiecţi de gen feminin). 254 .LOREDANA GHERASIM Variabilele sunt aşezate pe rânduri. apoi se introduce numele variabilei NRSUB folosind tastatura. Opţiunea TYPE permite specificarea tipului de date.

iar CUSTOM CURRENCY permite introducerea de valorilor pozitive dar şi a celor negative. Caracteristica LABELS permite definirea detaliată a variabilei (pot fi folosite până la maxim 256 caractere. dreapta sau central. respectiv orele şi minutele. Tipul SCIENTIFIC NOTATION transformă logaritmic valorile introduse. apare selectat tipul NUMERIC. Definirea detaliată a variabilei apare în pagina de rezultate. Tipul DOLLAR inserează în faţa valorilor simbolul dolarului. reţinând întreaga valoare. În acest scop vom activa opţiunea VALUE: 255 . presupunându-se că noile variabile vor fi numerice. Deşi sunt mai multe tipuri de variabile. virgulelor. afectând vizualizarea datelor. VALUE LABEL permite descrierea valorile pe care le poate lua o variabilă. Variabila Gen este de tip categorial. COLUMN permite specificarea numărului de caractere pentru o coloană. în psihologie se utilizează două tipuri de variabile. Ultima opţiune STRING permite introducerea variabilelor alfanumerice.ANALIZA COMPUTERIZATĂ A DATELOR Tipul NUMERIC permite introducerea valorilor cu sau fără zecimale. Opţiunea este folosită pentru variabile care folosesc coduri numerice pentru a reprezenta categorii (de exemplu. subiecţii de sex masculin îi vom codifica cu valoarea 1. vom defini numele variabilei NRSUB şi vom detalia eticheta la opţiunea LABEL ca în imaginea de mai jos: Vom introduce valorile şi vom defini şi următoarele variabile. se pot folosi valorile 1 şi 2 pentru a codifica genul feminin şi masculin). femei şi bărbaţi. aliniate la stânga. a barelor de separarea pentru a delimita zilele. Din acest motiv trebuie precizată semnificaţia valorilor variabilei. Astfel. MISSING VALUES permite stabilirea valorilor care nu vor fi luate în seamă la prelucrarea datelor. ANX2 şi Gen. Tipurile COMMA şi DOT permit introducerea valorilor cu orice număr de zecimale (mai mare de 16). NUMERIC şi STRING (foarte rar). inclusiv spaţiul). lunile şi anii. În exemplu nostru. Este posibilă alegerea numărului de cifre pentru partea întreagă (WIDTH) şi a numărului de zecimale (DECIMAL PLACES). cu sau fără separator pentru mii. punctelor. DATE permite folosirea spaţiilor. în funcţie de această caracteristică subiecţii fiind împărţiţi în două categorii distincte. Acest lucru presupune atribuirea de valori şi etichete celor două grupuri de subiecţi. ALIGNMENT permite modificarea modului în care sunt prezentate datele pe ecran. Opţiunea TYPE este de obicei folosită pentru modifica acest tip de date. ANX1. iar pe cei de gen feminin cu valoarea 2. Automat la crearea unei noi baze de date.

Vom salva fişierul cu numele Baza1. Salvarea fişierelor se face fie acţionând butonul SAVE care se găseşte în bara de instrumente. Se activează butonul OK pentru a salva modificările şi închide caseta de dialog. Astfel.sav în subdirectorul EXEMPLE SPSS care se găseşte în directorul MY DOCUMENTS. fie din meniul FILE se alege opţiunea SAVE.LOREDANA GHERASIM Se trece valoarea în câmpul VALUE şi numele grupului sau categoriei în câmpul VALUE LABEL. 256 . vom scrie „1” în câmpul VALUE şi „subiecţi de gen masculin” în câmpul VALUE LABEL şi activăm butonul ADD. după care se apasă butonul ADD. apoi vom scrie „2” în câmpul VALUE şi „subiecţi de gen feminin” în câmpul VALUE LABEL şi activăm butonul ADD. Această opţiune se foloseşte numai pentru variabilele categoriale. care împart subiecţii în grupuri distincte. Reamintim că trebuie ales mai întâi directorul în care vream să salvăm fişierul si apoi scriem numele fişierului.

Tabelul de frecvenţă.ANALIZA COMPUTERIZATĂ A DATELOR II. iar când curba este înclinată spre stânga. ANALIZA FRECVENŢELOR Tabelele de frecvenţă ajută la descrierea unui grup de scoruri. Spre exemplu. adică elevii au tendinţa de a obţine mai multe note mari. arată valorile în jurul cărora se grupează rezultatele subiecţilor. Atunci când curba este înclinată spre dreapta. fiind cele mai simple procedee ale statisticii descriptive. înclinarea şi turtirea sunt indicatori care descriu forma distribuţie scorurilor.1. Acestea presupun transformarea intervalelor de frecvenţă în bare. Faţă de curba normală o distribuţie poate fi mai turtită (scorurile din cadrul ei variază foarte mult de la medie) sau mai ascuţită (scorurile variază foarte puţin de la medie). notele şcolare au o distribuţie înclinată spre dreapta. Turtirea unei distribuţii se raportează la curba normală. înălţimea barelor corespunzând frecvenţei fiecărui interval de frecvenţă din tabelul de frecvenţă. distribuţiile fiind aproximativ simetrice (nu prezintă tendinţă de înclinare). Modalitatea indică câte “vârfuri” are o distribuţie. prezentând modul în care se distribuie sau se împrăştie cazurile sau frecvenţele. Aceasta se găseşte la meniul ANALYZE – DESCRIPTIVE STATIASTICS: 257 . informaţia devenind. distribuţia este înclinată pozitiv. Histogramele. Analiza de frecvenţă cu ajutorul programului SPSS Opţiunea FREQUENCIES permite realizarea tabelului de frecvenţă şi a distribuţiei de frecvenţă a rezultatelor. distribuţiile pot fi unimodale (au un singur vârf). astfel. bimodale (au două vârfuri) sau multimodale (au mai multe vârfuri). prin unirea mijloacelor părţilor superioare ale barelor histogramelor. ELEMENTE DE STATISTICĂ DESCRIPTIVĂ II. Din această perspectivă. reprezentări grafice ale tabelelor de frecvenţă permit o mai bună înţelegere a tendinţei grupului de rezultate. mai comprehensibilă. Cele mai multe aspecte măsurate în psihologie prezintă un număr aproximativ egal de cazuri de o parte şi de alta a mijlocului. histograma şi poligonul de frecvenţă descriu o distribuţie de frecvenţă. Poligoanele de frecvenţă sunt o altă modalitate de reprezentare grafică a datelor din tabelele de frecvenţă. O distribuţie este înclinată atunci când are o extremă (o parte) mai împrăştiată şi mai lungă. Acestea se obţin. distribuţia este înclinată negativ. Tabelele de frecvenţa grupează scorurile subiecţilor. Modalitatea. care permit înţelegerea tendinţei unui grup de scoruri. Înclinarea arată dacă în distribuţie apar mai multe valori mari sau mai multe valori mici. cu alte cuvinte.

împreună cu denumirea extinsă a variabilei. se bifează afişarea curbei normale (WITH NORMAL CURVE). Opţiunea FORMAT permite modificarea formei OUTPUT-ului. Activarea acestui buton are ca efect apariţia următoarei casete de dialog: 258 . butonul CHARTS permite afişarea histogramei de frecvenţă. Trecerea variabilelor în câmpul de analiză se realizează cu ajutorul butonului cu săgeată care se găseşte între câmpuri. Pentru afişarea histogramei de frecvenţă se activează butonul CHARTS: Opţiunea CHART TYPE permite alegerea unui tip de grafic (cu bare. Opţiunea STATISTICS deschide o fereastră cu opţiuni de prelucrare statistică. Opţiunea FORMAT permite modificarea formei de prezentare a datelor în foia cu rezultate (OUTPUT). Se selectează variabila ANX1 din câmpul din stânga şi se activează butonul de trecere: Pentru ca în foaia de rezultate să apară tabelul de frecvenţă se selectează opţiunea DISPLAY FREQUECY TABLES. în ordinea introducerii lor în baza de date. dorim realizarea tabelului de frecvenţă şi histogramei pentru variabila „nivelul anxietăţii înainte de terapie” (ANX1). plăcintă sau histogramă). CHART VALUES permite alegerea tipului de valori afişate în grafic (Frecvenţe sau Procentaje). Pentru exemplul nostru se selectează opţiunea HISTOGRAMS.LOREDANA GHERASIM După activarea opţiunii pe ecran apare următoarea casetă de dialog: În câmpul din stânga al casetei FREQUENCIES sunt afişate toate variabilele din baza de date. Acest mod de organizare în două câmpuri apare la aproape toate opţiunile de prelucrare a datelor. apoi se activează butonul CONTINUE. Pentru exemplul nostru. Bifarea opţiunii DISPLAY FREQUECY TABLES are ca efect afişarea în foaia de rezultate a tabelul de frecvenţă. Astfel. Se selectează din câmpul din stânga variabila pe care vrem să analizăm apoi se activează butonul de trecere. analiza statistică se realizează doar pentru variabilele trecute în acest câmp. Câmpul din dreapta reprezintă câmpul de analiză.

Coloana PERCENT transformă frecvenţa obţinută pentru fiecare valoare în procentaj ţinând cont de numărul total de subiecţi luaţi în calcul. Dacă unii subiecţi nu ar fi răspuns la chestionarul de anxietate.ANALIZA COMPUTERIZATĂ A DATELOR Câmpul din stânga al ferestrei conţine opţiuni de aranjare a rezultatelor (în ordine descrescătoare sau crescătoare a valorilor sau cantităţilor). putem vizualiza reprezentarea grafică a frecvenţei scorurilor: 259 . În cazul nostru coloanele PERCENT şi VALID PERCENT sunt identice deoarece toţi subiecţii au scoruri la această variabilă. doi subiecţi au obţinut scorul 103. ceea ce reprezintă 10% din totalul numărului de răspunsuri obţinute. indiferent dacă aceştia au sau nu scoruri la această variabilă. Al doilea tabel este organizat în cinci coloane. De exemplu. Coloana CUMULATIVE PERCENT prezintă procentajul cumulat. se activează butonul OK al casetei FREQUENCIES. cel din stânga. afişează structura sau cuprinsul OUPUT-ului. Rezultatele sunt organizate în două tabele. Pentru exemplu nostru. 60% dintre subiecţi au note mai mici sau egale cu 106. Pentru exemplul nostru. atunci cele două coloane ar fi conţinut valori diferite. VALID PERCENT prezintă procentajul luând în calcul doar subiecţii care au răspuns la această variabilă. Coloana FREQUENCY prezintă frecvenţa. Derulând pagina cu rezultate sau selectând HISTOGRAM în câmpul din stânga. Coloana VALID prezintă valorile variabilei. pentru fiecare variabilă. iar cel din dreapta arată conţinutul foii cu rezultate. Spre exemplu. iar cel din dreapta conţine opţiuni de prezentare comparativă a rezultatelor şi de organizare separată a foii de rezultate. numită OUTPUT: Fereastra OUPUT este organizată în două câmpuri. vom păstra opţiunile selectate automat. Pe ecran apare o fereastra cu rezultate. de la cel mai mic scor la până la cel mai mare. avem 20 de subiecţi care au răspuns la chestionar (nu lipseşte nici o valoare). prezentate în ordine crescătoare (fără a ţine seama de cazurile lipsă). După selectarea opţiunilor de realizare a tabelului de frecvenţă şi histogramei. adică numărul de subiecţi care obţin o anumită valoare. În primul tabel se precizează numărul de subiecţi şi numărul de răspunsuri.

Pentru exemplificare introducem variabila ANX1. IDENTIFICAREA TENDINŢEI CENTRALE ŞI A VARIABILITĂŢII SCORURILOR Metodele descriptive pentru identificarea tendinţei centrale şi de împrăştiere indică tendinţa centrală a unui grup de scoruri. folosind ca indicatori varianţa şi abaterea standard. arată valoarea tipică. selectarea acestei opţiuni va duce la afişarea curbei normală de distribuţie a rezultatelor. câmpul în care se introduce variabila pentru care dorim să realizăm histograma de frecvenţă 3. Activarea opţiunii duce la apariţia următoarei casete de dialog: 2 1 3 Elementele principale ale ferestrei sunt: 1. marcând opţiunea dorită (baza de date sau foaia de rezultate): II.LOREDANA GHERASIM Histograma de frecvenţă se mai poate obţine folosind meniul GRAPHS – HISTOGRAM. în câmpul VARIABLE şi bifăm opţiunea DISPLAY NORMAL CURVE. deoarece abaterile de la medie într-o direcţie (abaterile scorurilor mici de la medie) sunt egale cu 260 . cu ajutorul butonului cu săgeată. Vizualizarea ferestrei OUTPUT sau DATE (baza1. Se obţine aceeaşi reprezentare grafică ca şi în cazul folosirii butonului CHART al ferestrei FREQUENCIES. folosind ca indicatori media. câmpul în care sunt prezentate toate variabilele din baza de date 2.sav) se poate face folosind meniul WINDOW. Media aritmetică descrie tendinţa centrală într-un grup de rezultate.2. Media este punctul faţă de care scorurile sunt egal depărtate. reprezentativă a unui grup de scoruri. mediana şi modul şi tendinţa de împrăştiere a grupului de scoruri.

casetă de dialog care se deschide cuprinde patru câmpuri cu opţiuni: 261 . Pentru a cunoaşte exact cu cât variază scorurile în medie este nevoie să calculăm deviaţia standard. Este o măsură a gradului de variabilitate a scorurilor şi arată cât de mult se abat scorurile de la tendinţa centrală. jumătate dintre scorurile distribuţie având valori mai mici ca mediana. normale m+SD scoruri mari Scorurile care sunt mai mari decât media cu o abatere standard sunt considerare scoruri mari iar cele mai mici decât media cu mai mult de o abatere standard sunt considerate ca fiind scoruri slabe. După cum se poate vede şi în imaginea de mai jos. Abaterea standard ne arată cu cât se împrăştie scorurile în jurul valorii centrale şi se măsoară în aceleaşi unităţi de măsură ca şi scorurile iniţial. În intervalul cuprins între medie şi o abatere standard la stânga şi dreapta mediei găsim aproximativ 2/3 din totalul scorurilor.sav”.ANALIZA COMPUTERIZATĂ A DATELOR abaterile în cealaltă direcţie (abaterile scorurilor mari de la medie). acest indicator intrând în componenţa multor metodele statistice. Mediana şi modulul. Cu toate acestea. Se recomandă utilizarea mediei în distribuţiile simetrice şi unimodale. trebuie să ştim cât de mult (sau cu cât) se împrăştie scorurile în jurul valorii medii. Varianţa (SD2=( ∑ (X-M)2/N) unei distribuţii arată cât de “împrăştiate” sunt scorurile în jurul valorii centrale. cu atât mai mult se împrăştie scorurile în jurul valorii centrale. indică gradul de variabilitate a unui grup de rezultate. Ilustrăm grafic acest lucru: m-SD scoruri mici m scoruri medii. tipice. care sunt mai stabile sunt recomandate pentru descrierea distribuţiilor asimetrice şi multimodale. Vom calcula parametrii tendinţei centrale şi ai variabilităţii pentru variabila ANX1 (nivelul anxietăţii înaintea terapiei). Mediana împarte distribuţia în două părţi egale. Trebuie să cunoaştem gradul de variabilitate a scorurilor noastre. Aceste rezultate sunt considerate tipice sau normale pentru o distribuţie. Pentru analiză vom folosi baza de date realizată anterior. media aritmetică rămâne metoda cel mai des utilizată pentru descrierea tendinţei grupului de scoruri. Este indicatorul care este cel mai puţin afectat de schimbările structurii (modificări ale numărului de scoruri sau mărimii scorurilor distribuţiei). este cea mai “sensibilă” la modificarea numărului de scoruri sau mărimii scorurilor. Media. iar cealaltă jumătate valori mai mari. Mai precis. însă. Abaterea standard este rădăcina pătrată a varianţei (SD = SD 2 ). Cunoaşterea acestor indicatori nu este suficientă pentru a descrie complet o distribuţie. Există însă metode statistice (cum a fi testele neparametrice) în care se utilizează doar mediana şi modul. Cu cât este mai mare această valoare. Calculul tendinţei centrale şi a variabilităţii folosind SPSS Meniul din SPSS care permite calculul indicatorilor tendinţei centrale şi ai împrăştierii se găseşte la ANALYZE – DESCRIPTIVE STATISTICS – FREQUENCIES. Modul reprezintă valoarea cu frecvenţa cea mai mare. Se trece variabila în câmpul din dreapta apoi se activează butonul STATISTICS. Mediana este şi ea destul de puţin afectată de modificările structurii distribuţiei. „Baza1. fiind indicatorul cel mai descriptiv (deoarece indică orice modificare survenită în distribuţie).

Această opţiune permite calculul cuartilelor (QUARTILES) sau altor cuartile (de exemplu CUT POINTS FOR 10 EQUAL GROUPS) sau centile (PERCENTILE). MODE din câmpul CENTRAL TENDENCY şi opţiunile STD DEVIATION şi VARIANCE din câmpul DISPERSION: Activăm butonul CONTINUE şi apoi cel OK al casetei FREQUENCIES. CENTRAL TENDENCY conţine opţiunile folosite pentru calculul indicatorilor tendinţei centrale ale distribuţiei: media (MEAN). Pentru exemplu nostru ne interesează calculul parametrilor tendinţei centrale ai distribuţiei şi de împrăştiere. prin afişarea valorilor care delimitează aceste grupuri. DEVIATION).E. În consecinţă se bifează (cu un simplu click stânga al mouse-ului) opţiunile MEAN. varianţă (VARIANCE). mod (MODE) şi suma valorilor seriei (SUM). valori minime (MINIMUM) şi maxime (MAXIMUM) şi eroare standard (S. Opţiunile din câmpul DISPERSION permit calcularea diferiţilor parametri referitori la dispersia (împrăştierea) scorurilor în jurul valorii centrale: abatere standard (STD. MEAN care reprezintă abaterea standard a distribuţii tuturor mediilor posibile calculate pentru eşantioane aleatoare repetate). Valorile indicatorilor sunt grupate în tabelul Statistics: 262 . Câmpul DISTRIBUTION oferă posibilitatea aflării indicatorilor de turtire (KURTOSIS)şi înclinare ai unei distribuţii în comparaţie cu cea normală (SKEWNESS).LOREDANA GHERASIM Câmpul PERCENTILE VALUES conţine opţiuni care permit calculul valorilor corespunzătoare împărţirii subiecţilor în grupuri egale. mediana (MEDIAN). MEDIAN. amplitudine (RANGE).

Distribuţia scorurilor subiecţilor la această variabilă indică aceeaşi formă. Med=105.ANALIZA COMPUTERIZATĂ A DATELOR Astfel. Rezultatele obţinute sunt următoarele: Astfel. M=107. M=107. Mod=104. 263 . Distribuţia scorurilor este bimodală (apar două valori cu frecvenţa cea mai mare) şi înclinată spre valorile mici ale variabilei (media este mai mică decât mediana). ceea ce însemnă că distribuţia este unimodală (apare o singură valoare la mod) şi uşor înclinată spre dreapta spre valorile mai mari ale variabilei (valoarea mediei este mai mare decât a medianei).5. Med=109.90. Reprezentarea grafică indică apariţia unui singur vârf (distribuţie unimodală) şi o alungire şi împrăştiere a extremei drepte a distribuţiei (distribuţie înclinată spre dreapta). Mod=110 (a doua valoare a modul se extrage din tabelul de frecvenţă). La fel se calculează indicatorii tendinţei centrale şi de împrăştiere pentru variabila ANX2 (nivelul anxietăţii subiecţilor după terapie).5. Mod=102.95.

264 . deoarece acestui scor îi corespunde un scor Z de +2 (ceea ce înseamnă că scorul este mai mare ca media cu două deviaţii standard). distribuţia fiind mai turtită (în acest caz varianţa şi abaterea standard au valori mai mari). întrucât notele Z arată raporturi şi sunt adimensionale (nu depind de ceea ce măsurăm). Trebuie ţinut seama de o serie de reguli. iar limitei maxime de variaţie normală îi corespunde nota standard +1. un scor x raportat la distribuţia Z este considerat “mic”. un scor x este considerat “mare” raportat la distribuţia Z. De asemenea. un scor x este considerat “mediu” dacă scorul său Z este cuprins în intervalul [–1. Astfel. valorile fiind mai grupate în jurul medie (şi varianţa şi abaterea standard au valori mai mici). +1]. Permit compararea unui scor cu o distribuţie la care cunoaştem parametrii (media şi deviaţia standard). iar abaterea standard valoarea 1. La variabila ANX2 se constată o mai mare variabilitate a rezultatelor. astfel. Scorurile Z îndeplinesc o serie de funcţii. mediu sau mare. Spre exemplu. m-SD scoruri”mici” m scoruri medii. limitei minime de variaţie tipică îi corespunde scorul standard -1. II. Distribuţia în note Z este o distribuţie ideală în care media are întotdeauna valoarea 0. dacă scorurile la un test de inteligenţă într-o populaţia sunt descrise de media m=100 şi deviaţia standard SD=15. dacă scorul său Z are valoare mai mică decât –1.3. Mediei îi corespunde întotdeauna mereu scorul standard 0. distribuţia scorurilor pentru prima variabilă este mai ascuţită. Schema de mai jos prezintă notele standard Z corespunzătoare mediei şi limitelor de variaţie maximă şi minimă. ne ajută să precizăm dacă un scor este mic. O altă funcţie a notelor z este aceea că permit compararea scorurilor obţinute de aceeaşi persoană la probe diferite. dacă scorul său Z va fi mai mare decât +1. notele Z arată de câte ori acel scor este mai mare sau mai mic decât media (ţinând cont de variabilitate).LOREDANA GHERASIM Comparând reprezentările histogramele de frecvenţă pentru variabilele ANX1 şi ANX2. Nota standard Z arată cu câte deviaţii standard se abate un scor de la medie (Z=(X-M)/SD). SCORURILE Z Nota Z indică deviaţia unui scor (x) de la medie (m) exprimată în deviaţii standard. o persoană cu scorul brut 130 este „de două ori mai deşteptă ca media celorlalţi”. tipice normale m+SD scoruri”mari” x -1 0 +1 Z Aceasta distribuţie ne permite să stabilim cum este scorul x în raport cu media (care este 0) şi abaterea standard (care are valoarea 1). Astfel. putem analiza variabilitatea rezultatelor la cele două variabile.

Vom activa butonul CONTINUE şi apoi butonul OK al ferestrei pentru a putea face 265 .sav”). Vom folosi baza de date creată anterior („Baza1.ANALIZA COMPUTERIZATĂ A DATELOR Calculul notelor Z folosind SPSS Comanda DESCRIPTIVES care se găseşte în meniul ANALYZE – DESCRIPTIVE STATISTICS. Activarea comenzii duce la apariţia pe ecran a casetei de dialog următoare: 1 2 3 4 Prezentăm principalele elemente ale ferestrei DESCRIPTIVES: 1. Pentru exemplificare. cuprinde opţiuni de calcul ai parametrilor distribuţiei. câmpul în care se introduc variabilele care vor fi analizate 3. Se activează butonul OPTIONS. care deschide următoarea fereastră: Automat sunt selectate de computer opţiunile de calcul al mediei. 4. abaterii standard şi al valorii minime şi maxime. Se bifează opţiunea SAVE STANDARDIZED VALUES AS VARIABLES. vom calcula notele Z pentru variabila ANX1. permite calculul notelor Z cu ajutorul SPSS. opţiunea SAVE STANDARDIZED VALUES AS VARIABLES permite salvarea în baza de date a scorurilor standard sub forma unei noi variabile. câmpul în care sunt prezentate variabilele din baza de date 2.

scorurile medii la prima variabilă se asociază cu scoruri medii la a doua variabilă şi scorurile mari la 266 . Scorul primului subiect este atipic. care are un scor z–0. ceea ce semnifică faptul că subiectul are un nivel ridicat al anxietăţii raportat la ceilalţi subiecţi. pe ultima coloană. II. De exemplu.+1).LOREDANA GHERASIM analiza statistică. nivelul anxietăţii acestuia fiind de 2 ori şi jumătate mai mare decât media. dar plasându-se în limita (–1 . Prin transformarea notelor brute obţinute de subiecţi la cele două variabile putem să identificăm dacă exista sau nu o legătură între aceste două variabile. rezultatul fiind aproape cu o unitate mai mic decât media. Vom vizualiza baza de date pentru a vedea dacă apare noua variabilă care conţine rezultatele subiecţilor transformate în note Z.4. cu numele ZANX1. Corelaţia indică existenţa unei legături între variabile. Se observă apariţia unei noi variabile. Rezultatele obţinute în urma comenzii DESCRIPTIVES sunt mai sumare şi prezentate într-un singur tabel. iar cea mai mică valoare la anxietate a obţinut-o subiectul 8.98 pentru o valoare brută de 102. Putem analiza rezultatele obţinute. întrucât ea descrie ce se petrece într-un grup de rezultate (r=( ∑( Z1 * Z 2) / N ). legătură care poate fi pozitivă (când scorurile slabe la prima variabilă se asociază cu scoruri slabe la a doua variabilă. Se constată că cel mai mare scor z este 2. putem analiza legătura dintre nivelul stresului unui manager şi numărul de subordonaţi.6 care corespunde unui scor standard 124 obţinută de subiectul 15. Corelaţia este o metodă statistică descriptivă. COEFICIENTUL DE CORELAŢIE PEARSON Notele Z fac posibilă analiza legăturii dintre două variabile. Subiectul al doilea are un nivel normal al anxietăţii.

fie y poate fi cauză pentru x.050).01 (1% eroare) şi pragul de 0. Astfel. Situaţia I corespunde minciunii. corespunzătoare procentajului de eroare: pragul de 0. Există trei modalităţi de interpretare a unui coeficient de corelaţie obţinut între două variabile (x şi y): fie x poate fi cauză pentru y. indică dacă există o legătură între două sau mai multe variabile. când se fac predicţii pot să apară patru situaţii. fie a apărut a o treia variabilă care a determinat apariţia simultană a celor doua variabile. iar corelaţia negativă poate lua valori la de -1 la 0. vom considera un test statistic ca fiind semnificativ dacă pragul de semnificaţie este mai mic sau cel mult egal cu valoarea 0. Dacă vrem să evităm primul tip de greşeală care are consecinţe mai grave (de a demonstra ceva ce nu există în realitate). Coeficientul de corelaţie (r) indică gradul în care apare paternul unei relaţii între cele două variabile. alegem pragul de semnificaţie de 0. cercetătorul se aşteaptă la un anumit rezultat. Bineînţeles că între variabile poate să nu apară nici o legătură. Acest coeficient poate lua valori de la -1 la +1.050.05 (5% eroare). În general. Ipoteza din exemplul nostru ar putea fi formulată direcţional.010 (prag de eroare de 1%). Pragul de semnificaţie. ne interesează să ştim în ce măsură rezultatele se datorează întâmplării. În psihologie se lucrează cu două modalităţi de formulare a ipotezelor (non-direcţionale sau direcţional). Testul de semnificaţie pentru verificarea acestui tip de ipoteză este ONE-TAILED.ANALIZA COMPUTERIZATĂ A DATELOR prima variabilă se asociază cu scoruri mari la a doua variabilă). În cazul corelaţiei. atunci se preferă pragul de eroare de 5% (deci un p=0. Testul de semnificaţie pentru verificarea acestui tip de ipoteză este TWO-TAILED. În cercetarea ştiinţifică se lucrează de obicei cu două praguri de semnificaţie. indică în ce măsură ne înşelăm atunci când afirmăm ceva. Pentru aceste ipoteze probabilitatea de eroare se stabileşte la una dintre extremităţile distribuţiei. scorurile medii la prima variabilă se asociază cu scoruri medii la a doua variabilă şi scorurile mari la prima variabilă se asociază cu scoruri mici la a doua variabilă). În testarea acestor ipoteze probabilitatea de eroare de 1% sau 5% se împarte la cele extremităţi (cozi) ale distribuţiei scorurilor. Pragul de semnificaţie (p) În psihologie este necesară generalizarea concluziile studiilor. negativă (când scorurile slabe la prima variabilă se asociază cu scoruri mari la a doua variabilă. Mai precis. În concluzie. prezentate în tabelul de mai jos: Evenimentul Apare Nu apare Predicţia Apare Corect Eroarea I Evenimentului Nu apare Eroarea II Corect Sunt două situaţii în care se poate greşi: când afirmăm că un eveniment se va produce şi în realitate acesta nu va apărea (eroare de tip I) sau când afirmăm că un eveniment nu se va produce şi aceste va apare (Eroare de tip II). corelaţia pozitivă poate lua valori de la 0 la 1. Dacă dorim însă să avem mai multe şanse în a demonstra ceva şi consecinţele nu sunt grave în caz de greşeală. Analiza corelaţiei dintre două variabile nu permite stabilirea relaţiei de cauzalitate între aceste variabile. În cazul nostru ipoteza ar putea fi formulată non-direcţional astfel: există o legătură între salariul iniţial şi final al subiecţilor. după analiza rezultatelor corelaţiei ne interesează să vedem dacă legătura găsită (la un grup de oameni) poate fi extinsă la întreaga populaţie. Ipotezele direcţionale sunt cele în care se precizează tipul de modificare. 267 . Ipotezele non-direcţionale sunt cele în care nu se precizează tipul de relaţie dintre variabile. pragul de semnificaţie. iar situaţia II corespunde ignoranţei. p.

175.sav”. 3 • sal_in: 189. 542. 1. 298. 199 Pentru calculul corelaţiei se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE: Activarea comenzii va deschide următoarea fereastră: 1 2 3 4 5 5 Elementele principale ale ferestrei sunt: 1. 221. 3. 214. Calcularea corelaţiei Pearson cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza2. 305. 392. câmpul de analiză. se pot introduce mai multe variabile. Sal_in (salariul iniţial al subiecţilor) şi sal_fin (salariul final al subiecţilor). 280. 214. cu cât salariul iniţial este mai mare cu atât şi salariul final va fi mai mare. care va cuprinde 3 variabile: STUDII (nivelul de studii al subiecţilor) cu trei valori 1 (studii generale). 2. 2. 298. 3. 206. 220. 2. 301. 1. 268 . 1. câmpul care prezintă lista variabilelor din baza de date. 203. 3. 2 (studii medii) şi 3 (studii superioare). 625. 197. 245 • sal_fin: 201. 725.LOREDANA GHERASIM astfel: legătura dintre salariul iniţial şi final este pozitivă. coeficienţii KENDALL şi SPEARMAN se folosesc pentru date categoriale şi ordinale. 301. 185. calculatorul afişând corelaţiile între variabilele luate două câte două. 178. 2. 3. 210. 2. 582. 260. 341. 1. 332. 201. 445. 502. 2. 205. 425. 2. 3. 201. în câmpul CORRELATION COEFFICIENTS se alege tipul de corelaţie: coeficientul Pearson se foloseşte pentru date parametrice (variabile cantitative şi continui). 220. 185. 156. 274. 1. 954. 205. 3. 258. 403. 1. 654. 168. 3. 168. 198. 2. aceste variabile au următoarele valori: • studii:1. 2. 3. 401. 1. unde se introduc variabilele ce vor fi analizate.

la fel ca şi celelalte opţiuni test de semnificaţie TWO-TAILED şi marcarea cu asterisc a corelaţiilor semnificative FLAG SIGNIFICANCE CORRELATIONS. 5. Pentru baza de date creată vom analiza legătura dintre variabilele salariu iniţial şi final al subiecţilor.ANALIZA COMPUTERIZATĂ A DATELOR 4. Vom introduce variabilele SAL_INI şi SAL_FIN în câmpul din dreapta. Se recomandă utilizarea primei variante selectată implicit. Coeficientul de corelaţie Pearson este selectat implicit de către calculator. câmpul TEST OF SEGNIFICANCE permite selectarea modului de testate a ipotezei (TWOTAILED sau ONE-TAILED). opţiunea FLAG SIGNIFICANCE CORRELATIONS are ca efect apariţia unui asterisc (*) în dreptul corelaţiilor semnificative. în foaia OUTPUT sunt afişate următoarele rezultate: 269 . 6. butonul OPTIONS este urmat de apariţia unei casete de dialog. După activarea butonului OK. Aceasta permite realizarea unei analize descriptive a datelor (STATISTICS) şi precizarea modalităţii de tratament a datelor lipsă MISSING VALUES. de obicei se foloseşte pragul TWO-TAILED în testarea ipotezelor de cercetare cu ajutorul SPSS. prin excluderea din analiză a perechilor de rezultate în care avem doar una dintre valori (EXCLUDE CASES PAIRWISE) sau de a exclude din analiză un rând întreg dacă doar una dintre valori lipseşte (EXCLUDE CASES LISTWISE).

50.30. În celula din dreapta sus apare coeficientul de corelaţie dintre salariul iniţial şi salariul final (ANX1 şi ANX2). Acest coeficient de corelaţie nu aduce nici un fel de informaţie şi în consecinţă nu se analizează. N=24 (numărul de subiecţi). că legătura este slabă dacă valoarea absolută a lui r nu depăşeşte 0. Sunt mai multe elemente de care trebuie să se ţină seama în interpretarea corelaţiei: • semnul corelaţiei: arată natura legăturii care există pozitive (dacă semnul este pozitiv) sau negative (dacă semnul este negativ).SIG. În consecinţă rezultatul poate fi extras din oricare din cele două celule. (2-TAILED) apare probabilitatea de eroare la respingerea ipotezei de nul şi acceptare a ipotezei de cercetare Rândul 3 .30-0. un salar iniţial mediu se asociază cu un salar final mediu şi un salar mare iniţial se asociază cu salariu mare final. Vom extrage datele pentru legătura dintre salariul iniţial şi salariul final al subiecţilor: Interpretarea corelaţiei: r=0. legăturile puternice având o mărime absolută mai 270 . p<0. semnificaţia acestuia şi numărul de perechi de scoruri. astfel. Acelaşi rezultate apar şi în celula din stânga jos care prezintă coeficientul de corelaţie dintre salariul final şi salariul iniţial (ANX2 şi ANX1). Se consideră.PEARSON CORRELATION se găsesc valorile coeficienţilor de corelaţie dintre două variabile Pe rândul 2 . cu un salariu tot mic.N conţine numărul de subiecţi care au scoruri la ambele variabile În tabel apare legătura dintre fiecare variabilă şi ea însăşi (ANX1 şi ANX1 şi respectiv între ANX2 şi ANX2) dar şi legătura dintre cele două variabile (între ANX1 şi ANX2 dar şi între ANX2 şi ANX1). semnul este pozitiv. • mărimea absolută a coeficientului: descrie tăria legăturii care apare între variabile. ceea ce înseamnă că un salar iniţial mic se asociază.81 (coeficientul de corelaţie).0).LOREDANA GHERASIM 2 4 1 3 5 Se observă că cele două variabile apar pe coloane da şi pe linii. după cinci ani. În cazul nostru. Prima celulă din stânga (notată cu 4) prezintă coeficientul de corelaţie între variabila salariul iniţial şi salariul iniţial (ANX1 şi ANX1). dar lipsită de semnificaţie (nu apare nici un prag de semnificaţie). legătura este medie la o valoare a lui r cuprinsă între 0. Rezultatele sunt identice deoarece corelaţie este bidirecţională (corelaţia dintre variabilele A şi B este acelaşi lucru cu cea dintre variabilele B şi A). Între o variabilă şi ea însăşi apare o corelaţie perfect pozitivă (r=1.001 (pragul de semnificaţie). La fel nu se analizează corelaţia dintre variabila salariul final şi salariul final (ANX2 şi ANX2). Pe rândul 1 .

Se observă că abia 65% din variaţia observată se întâlneşte în realitate. • proporţia de varianţă. se foloseşte comanda SELECT CASES din meniul DATA.1% (calculatorul ne afişează doar primele trei zecimale). În exemplul nostru. atunci putem considera că există o relaţie între variabilele studiate. vrem să vedem dacă legătura dintre salariul iniţial şi salariul final are aceeaşi valoare la subiecţii care au studii generale.81.05. Putem spune că există o legătură semnificativă între nivelul iniţial şi final al salariului subiecţilor.001.50 • pragul de semnificaţie dacă este mai mic de 0. Pe noi ne interesează opţiunea IF CONDITION IS SATISFIED. Proporţia de varianţă indică la ce procent din populaţia generală apare relaţia. Toate aceste elemente trebuie să apară în interpretare. În exemplu nostru.65 (r=0. În aceste situaţii se raportează un p<0. pragul de semnificaţie fiind mai mic de 0. Comanda SELECT CASES Uneori este necesară selectarea anumitor cazuri din populaţie pentru a face o prelucrare statistică. deci relaţia găsită este prezentă la 65% dintre subiecţi. tăria legăturii este ridicată (r=0. Această opţiune se alege cu un simplu click stânga al mouse-ului: Se activează butonul IF. Pentru a selecta numai subiecţii care au studii generale.65).05. valoarea este 0.000. pentru ca ea să fie completă. Spre exemplu. Pentru exemplu nostru proporţia de varianţă are valoarea 0. deoarece vrem să selectăm numai cazurile care îndeplinesc o anumită condiţie (să aibă valoarea 1 la variabila studii adică să fie numai subiecţi cu studii generale). Activarea meniului este urmată de apariţia următoarei ferestre: În câmpul din stânga al ferestrei sunt prezentate toate variabilele din baza de date. care deschide următoarea casetă de dialog: 271 . Subiecţii sunt împărţiţi în grupe în funcţie de nivelul de studii (studii).ANALIZA COMPUTERIZATĂ A DATELOR mare de 0. fiind codificaţi cu 1 în baza de date.81) coeficientul având valoare mi mare de 0.50. pentru a arăta că probabilitatea de a greşi este mai mică decât 0. În dreapta ferestrei apar mai multe opţiuni. deci r2=0. Coeficientul de corelaţie ridicat la pătrat ne indică proporţia de varianţă explicată de relaţia găsită.

variabila Studii trebuie să aibă numai valoarea 1 (STUDII=1). În cazul nostru se selectează variabila STUDII şi se trece în câmpul din dreapta: Se adăugă condiţia. baza de date modificându-se. Se poate folosi tastatura sau se pot activa butoanele cu cifre şi semne ce se găsesc sub acest câmp. cum se poate observa şi în imaginea de mai jos: 272 . Condiţia va arăta astfel: Se apasă apoi butonul CONTINUE pentru a salva condiţia: Se activează butonul OK.LOREDANA GHERASIM Se selectează variabila în funcţie de cre se face selecţia şi se trece în câmpul dintre dreapta sus. Pentru exemplul nostru.

În partea din dreaptajos a ecranului apare anunţul FILTER ON. Explicaţia lipsei de semnificaţie a corelaţiei dintre cele două variabile (în condiţiile în care coeficientul de corelaţie are valoare ridicată) este numărul mic de subiecţi.69. intitulată FILTER_$. valoarea lui r depăşeşte valoarea de 0. În cazul subiecţilor cu studii generale se constată că nivelul mic al salariului iniţial se asociază cu un nivel mic al salariului final. În continuare vom interpreta aceste rezultate: • semnul corelaţiei: corelaţie pozitivă. adică ele vor fi ignorate de la analiză. Cazurile neselectate sunt “tăiate”. • mărimea absolută a coeficientului: puterea legăturii dintre cele două variabile este ridicată. După selecţie trebuie făcută prelucrarea statistică a datelor. deci nu există o legătură semnificativă între salariul iniţial şi final al subiecţilor care au studii generale. deci relaţia găsită apare la 47% dintre subiecţii cu studii generale.056. care indică rezultatul selecţiei.050. • pragul de semnificaţie: valoarea pragului de semnificaţie este mai mare de 0. Numărul de subiecţi din analiză influenţează valoarea pragului de semnificaţie al corelaţiei dar nu şi puterea legăturii dintre variabile.ANALIZA COMPUTERIZATĂ A DATELOR La sfârşitul bazei de date apare o nouă variabilă.50. salariul iniţial mediu se asociază cu un salar final mediu. • proporţia de varianţă explicată de relaţia este r2=0. care avertizează utilizatorul cu privire la activarea unei comanzi de selecţie Atenţie! Selectarea datelor nu implică şi efectuarea analizei statistice.47. Se obţine următorul tabel în fereastra cu rezultate: Rezultatul obţinut este următorul: r=0. 273 . legătura este direct proporţională. salariul iniţial mare se asociază cu un salar final mare. În cazul nostru trebuie utilizată comanda de analiză a corelaţiei dintre salariul iniţial şi cel final. p=0.

în partea dreaptă-jos a bazei de date apare anunţul SPLIT FILE ON. Pentru baza de date BAZA2. simpla împărţire a bazei de date nu asigură prelucrarea statistică. Se activează apoi butonul OK. astfel. Comanda SPLIT FILE Uneori însă dorim să vedem ce se întâmplă pentru fiecare subgrup de subiecţi în parte. pentru fiecare condiţie a variabilei independente: studii generale.sav. trebuie folosită comanda CORRELATIOS pentru a analiza legătura dintre variabilele salariu iniţial şi final al subiecţilor. şi anume comanda SPLIT FILE. vom analiza legătura dintre variabilele salariul iniţial şi salariul final pentru toate categoriile de subiecţi în funcţie de variabila STUDII (nu numai pentru subiecţii cu studii generale dar şi pentru cei cu studii medii şi superioare). cu ajutorul săgeţii. introducem variabila de grupare (STUDII) în câmpul care se activează sub această opţiune: După apăsarea butonului OK. medii şi superioare: 274 . Rezultatele analizei statistice sunt prezentate separat. Pentru a nu repeta comanda SELECT CASES de multe ori se poate utiliza o altă comandă din meniul DATA.LOREDANA GHERASIM După folosirea acestui “filtru” este indicată dezactivarea.SELECT CASES. se deschide din nou în meniul iniţial DATA . La fel ca şi în cazul comenzii SELECT CASES. Pentru dezactivarea selecţiei. care avertizează utilizatorii că baza de date este împărţită în funcţie de condiţiile (nivelurile) variabilei de grupare . De aceea. Activarea comenzii SPLIT FILE deschide următoarea fereastră: Dintre opţiunile din dreapta alegem ORGANIZE OUTPUT BY GROUPS şi apoi. În partea de jos a ferestrei se găseşte buton RESET. comanda de filtrare a datelor dispare. în fişierul OUTPUT.

care deschide următoarea fereastră: 275 . graficul îl alegem din meniul GRAPHS. care să ilustreze relaţia dintre două variabile. care deschide fereastra: Vom alege un grafic simplu. deci vom selecta opţiunea SIMPLE. comanda SCATTER. Se activează apoi butonul DEFINE.ANALIZA COMPUTERIZATĂ A DATELOR nivelul de studii al subiecţilor = studii generale nivelul de studii al subiecţilor = studii medii nivelul de studii al subiecţilor = studii superioare Graficul corelaţiei Relaţia dintre două variabile poate fi reprezentată grafic sub forma unui nor de puncte. Practic.

81). norul de puncte ar fi fost orientat 276 .LOREDANA GHERASIM Se introduc cele două variabile în câmpurile axei X şi axei Y (nu contează ordinea în care se introduc variabilele deoarece corelaţia este bidirecţională) şi apoi se apasă butonul OK. Dacă relaţia ar fi fost invers proporţională. grupate deoarece coeficientul de corelaţie are valoare ridicată (r=0. iar punctele sunt apropiate. Reprezentarea grafică a corelaţiei este următoarea: Reprezentarea grafică a corelaţiei apare sub forma unui nor de puncte. Pentru exemplul nostru norul de puncte este ascendent crescător (din stânga-jos spre dreapta-sus) deoarece relaţia dintre variabile este pozitivă.

punctele ar fi fost distribuite uniform pe grafic. trebuie să folosim coeficientul de corelaţie Kendall's. iar valoarea absolută a coeficientului indică puterea relaţiei. Prof_1 (evaluarea interesului elevilor faţă de şcoală de către primul profesorul) şi Prof_2 (evaluarea interesului elevilor faţă de şcoală realizată de al doilea profesor). În cazul în care nu ar fi nici o relaţie. II. Calcularea corelaţiei Kendall cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza3. Cu cât valoarea coeficientului este mai mare cu atât relaţia dintre variabile este mai mare. apoi se introduc variabilele prof_1 şi prof_2 în câmpul din dreapta. În tabelul următor prezentăm valorile acestor variabile.ANALIZA COMPUTERIZATĂ A DATELOR descrescător (din stânga-sus spre dreapta-jos). Din câmpul CORRELATION COEFFICIENTS se bifează coeficientul de corelaţie Kendall's: După confirmarea comenzii în foaia cu rezultate apare următorul tabel: 277 .5. semnul coeficientului de corelaţie Kendall's tau-b indică direcţia relaţiei. La fel ca şi în cazul corelaţiei Pearson. Acest coeficient de corelaţie poate lua valori doar intre -1 şi 1. COEFICIENTUL DE CORELAŢIE KENDALL'S TAU-B Reprezintă o măsură non-parametrică a asocierii variabilelor ordinale sau rangate care presupun cantităţi.sav”. Pentru calculul acestei corelaţii se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE. Pentru a analiza legătura dintre evaluarea făcută de primul profesorul şi evaluarea realizată de al doilea profesor (prof_1 şi prof_2). care va cuprinde 3 variabile: elevi (codul de identificare al elevilor).

de la cele mai mici la cele mai mari. COEFICIENTUL DE CORELAŢIE SPEARMAN Este o măsurare non-parametrică a corelaţiei dintre două variabile ordinale. Pentru calculul acestei corelaţii se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE. Dacă ar fi apărut o asociere negativă dintre variabile (coeficientul de corelaţie ar fi fost negativ) s-ar fi interpretat astfel: elevii plasaţi pe primele locuri de către primul profesor s-ar fi plasat în coada clasamentului din perspectiva celui de al doilea profesor. Pentru a analiza legătura dintre evaluarea interesului faţă de şcoală al elevilor şi evaluarea relaţiilor cu ceilalţi colegi (eval_i şi eval_re) se foloseşte coeficientul de corelaţie Spearman. valorile fiecărui tip de variabilă sunt rangate. Asocierea nu este însă semnificativă. Se foloseşte atunci când nu este posibilă măsurarea caracteristicilor analizate ci doar evaluarea lor. Acest coeficient de corelaţie mai este denumit şi coeficient de corelaţie a rangurilor. Această evaluare presupune atribuirea de valori care indică ierarhia subiecţilor (cum ar fi primul. Se introduc variabilele eval_i şi eval_re în câmpul din dreapta. în asemenea manieră încât indivizii statistici să fie ordonaţi în funcţie de două criterii X şi Y. eval_i (evaluarea de către profesori a interesul pentru şcoală) şi eval_re (evaluarea de către profesori a relaţiilor cu ceilalţi elevi). Calcularea corelaţiei Spearman cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza4. care va cuprinde 3 variabile: elevi (codul de identificare al elevilor). p=0.sav”. Pentru toate cazurile. Modalitatea de calcul a corelaţiei Spearman este similară coeficientului Pearson (de fapt de aplică formula coeficientului Pearson). al treilea). elevii clasaţi pe primele locuri de către primul profesor ocupă tot o poziţie fruntaşă din perspectiva celui de al doilea profesor. Din câmpul CORRELATION COEFFICIENTS se bifează coeficientul de corelaţie Spearman: 278 . al doilea. II.091 posibila explicaţie fiind numărul mic de subiecţi din baza de date.6.60).LOREDANA GHERASIM Se constată că apare o asociere pozitivă între variabile (r=0.

relaţii bune cu ceilalţi elevi.80.81. Deci vom calcula mai întâi valoarea medianei şi apoi vom împărţi subiecţii în grupe în funcţie de valoarea acestui indicator.03.71.06.050 (p=0.79. 7. 7.54 Vom împărţi elevii în două grupe (grupul elevilor cu performanţe bune şi grupul elevilor cu performanţe slabe). 9. 8.sav) care conţine mediile obţinute de elevi la sfârşitul anului şcolar. 8. 7. 7.16.06. Pentru calculul medianei vom folosi comanda DESCRIPTIV STATISTICS– FREQUENCIES: 279 .88. 9. 8. 7. Inversarea clasamentului nu este semnificativă. prin crearea unei noi variabile în baza de date sau modificarea valorilor unei variabile existente în baza de date.7.91. 6.06.260). ceea ce semnifică faptul că elevii plasaţi pe primele locuri ale variabilei interes pentru şcoală ocupă ultimele locuri după cel de al doilea criteriu.76.88. Valorile variabilei sunt: Media: 8. 8. RECODIFICAREA ŞI TRANSFORMAREA VARIABILELOR Uneori este necesar ca scorurile brute obţinute de subiecţii unui studiu să fie transformate pentru a putea verifica ipoteza studiului. 8.10. 9. 6.86.49. Împărţirea elevilor în două grupe se realizează în funcţie de mediană.19.78. 7. Aplicaţia SPSS are o serie de comenzi care permit transformarea sau recodificarea unei variabile cantitative într-o variabilă calitativă.73. 7. 9. Pentru a exemplifica utilizarea comenzilor de recodificare vom crea o nouă bază de date (baza5. 7. 7. pragul de semnificaţie fiind mai mare de 0. 8. acest indicator statistic împărţind şirul de scoruri în două parţi egale (proba medianei).49.ANALIZA COMPUTERIZATĂ A DATELOR După confirmarea comenzii în foaia cu rezultate apare următorul tabel: Se constată că apare o inversare a clasamentului. 9.81. II. corelaţia având semn negativ. 6.69.04.

Pentru recodificarea variabilei MEDIA se utilizează opţiunea RECODE care se găseşte la meniul TRANSFORM: Comanda RECODE are două opţiuni de recodificare. 2.LOREDANA GHERASIM Pentru exemplul nostru mediana are valoare 7. Comanda RECODE INTO DIFFERENT VARIABLES Selectăm opţiunea de creare a unei noi variabile care să cuprindă grupele obţinute în urma recodificării.95) vor forma grupul celor cu performanţe scăzute. 4. Vom denumi noua variabilă NIVPERF. iar subiecţii care au valori mai mari decât mediana vor forma grupul celor cu performanţe ridicate. Subiecţii care au valori mai mici ca mediana (7. 3 în câmpul INPUT VARIABLE →OUTPUT VARIABLE se introduce atât variabila ce urmează să fie recodificată cât şi numele noii variabile. ceea ce are ca urmare apariţia următoarei casete de dialog: 3 1 2 5 4 1. în câmpul NAME de la OUT VARIABLE se introduce numele variabilei create. butonul OLD AND NEW VALUE permite recodificarea variabilei iniţiale 5 butonul IF permite crearea unei noi variabile doar prin selecţia anumitor valori ale variabilei iniţiale Pentru exemplul nostru vom trece variabila pe care dorim să o recodificăm. MEDIA. Se poate păstra variabila ce urmează să fie recodificată (INTO SAME VARIABLES) sau se poate crea o nouă variabilă (INTO DIFFERENT VARIABLES).95. câmpul care conţine variabilele din baza de date. Noul nume se tastează în câmpul NAME al câmpului OUTPUT VARIABLE: 280 . în câmpul din mijloc al ferestrei cu ajutorul butonului de trecere. Se selectează opţiunea INTO DIFFERENT VARIABLES.

Activarea acestui buton deschide următoarea casetă de dialog: 2 1 3 Această fereastră prezintă mai multe câmpuri: 1. În câmpul NEW VALUE. Cu alte cuvinte această opţiune va însemna că toate valorile variabilei MEDIA mai mici de 7. LOWEST THROUGH din câmpul OLD VALUE şi vom trece în câmpul activat valoarea medianei (7. vom activa opţiunea RANGE.95).95) vor forma grupul subiecţilor cu performanţa scăzută. care va reprezenta valoarea 1 a variabilei NIVPERF (ce va fi creată). în câmpul de lângă opţiunea VALUE. se activează butonul CHANGE din câmpul OUTPUT VARIABLE: Se activează butonul OLD AND NEW VALUE pentru a defini valorile noii variabile. subiecţii care au obţinut scoruri mai mici decât mediana (7. în câmpul OLD→NEW se reunesc opţiunile de recodificarea a variabilelor În exemplul nostru. vom tasta valoarea 1: 281 . câmpul OLD VALUE se referă valorile variabilei iniţiale 2. câmpul NEW VALUE face referire la valorile noii variabile 3. formând o nouă variabilă.ANALIZA COMPUTERIZATĂ A DATELOR Pentru ca noul nume al variabilei să apară în câmpul din mijloc INPUT VARIABLE →OUTPUT VARIABLE şi astfel să aibă loc recodificarea. prind valoarea în cadrul noii variabile NIVPERF.95 vor fi recodificate. Astfel. trebuie ca valorile variabilei MEDIA (variabila iniţială) să le redefinim. În consecinţă.

cei cu valori cuprinse între 7. Se observă că în baza de date apare noua variabilă NIVPERF. după cum se poate observa şi în imaginea din dreapta. cu două valori.73 vor forma grupul celor cu performanţa scăzută (grupul 1).95 ale variabilei MEDIA vor primi valoarea 1 în cadrul variabilei NIVPERF. 282 . a doua treime grupul subiecţilor cu performanţă medie. mai întâi trebuie să calculăm valorile corespunzătoare percentilelor care împart şirul de scoruri în 3 parţi egale (fiecare parte reprezentând 33.95 ale variabilei MEDIA vor reprezenta valoarea 2 al variabilei NIVPERF.66%). Pentru a putea face împărţirea. ceea ce duce la modificarea bazei de date. THROUGH HIGHEST din câmpul OLD VALUE şi se trece în câmpul activat valoarea medianei (7. iar valorile mai mari de 7. iar cei cu medii mai mari de 8.64 vor reprezenta grupului cu performanţa ridicată (grupul 3). Pentru a fi reţinută şi această a doua condiţie de recodificare. Se activează apoi butonul CONTINUE şi butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES. în câmpul NEW VALUE. Subiecţii cu valori mai mici de 7. Din câmpul PERCENTILE VALUES se bifează opţiunea PERCENTILE şi se introduc centilele care împart şirul de scoruri în 3 parţi egale (adică 33. iar ultima treime grupul subiecţilor cu performanţă ridicată. Există posibilitatea de a împărţi valorile unei variabile în mai mult de două grupe.73 şi 8.LOREDANA GHERASIM Se apasă apoi butonul ADD al câmpului OLD→NEW. Această opţiune va însemna că valorile mai mari de 7. scorurile mai mici de 7. Pentru exemplificare vom împărţi scorurile la variabila MEDIA în trei parţi egale. în câmpul de lângă opţiunea VALUE.95 ale variabilei MEDIA vor fi recodificate în variabila NIVPERF primind valoarea 2. Prima treime va alcătui grupul subiecţilor cu performanţă scăzută. Se foloseşte comanda DESCRIPTIV STATISTICS– FREQUENCIES. Puteţi verifica dacă recodificarea a fost corect realizată.33% din total).33% şi 66. vom tasta valoarea 2. imaginea din stânga. În concluzie. cum se poate observa şi în imaginea din mai jos. Apoi se activează opţiunea RANGE. În consecinţă. se acţionează din nou butonul ADD din câmpul OLD→NEW.95).64 vor forma grupul subiecţilor cu performanţă de nivel mediu (grupul 2). pentru a putea recodifica următoarele valori.

Pentru crearea ultimului grup.ANALIZA COMPUTERIZATĂ A DATELOR Pentru a crea această nouă variabilă se activează meniul TRANSFORM – RECODE . Activăm apoi butonul ADD al câmpului OLD→NEW. cu trei valori.64 vor reprezenta nivelul 2 al variabilei NIVPERF2. care cuprinde valori mai mari de 8.73 şi 8. iar în câmpul NEW VALUE vom trece valoarea 1. Se activează apoi butonul CONTINUE şi butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES.73. scorurile mai mici de 7. cu excepţia faptului că se păstrează numele iniţial al variabilei recodificate. tastând noul nume în câmpul NAME al câmpului OUT VARIABLE şi apoi activând butonul CHANGE. cum se poate observa şi în imaginea alăturată.INTO DIFFERENT VARIABLES. Comanda RECODE INTO SAME VARIABLES Rezultate similare se obţin dacă se utilizează comanda RECODE opţiunea INTO SAME VARIABLES. Activarea comenzii duce la apariţia casete de dialog: 283 . În acest exemplu. Valorile variabilei MEDIE cuprinse între 7.64 se activează opţiunea RANGE. Vom denumi noua variabila NIVPERF2. adică nivelul 1 al noii variabile NIVPERF2. THROUGH HIGHEST din câmpul OLD VALUE. ceea ce duce la modificarea bazei de date. apoi se activează butonul ADD. cum se poate observa şi în imaginea alăturată: Se observă că în baza de date apare noua variabilă NIVPERF2.73 ale variabilei MEDIA vor forma primul grupului 1. Pentru exemplificare vom utiliza aceeaşi bază de date (baza5. Vom activa opţiunea RANGE. pentru a putea introduce următoarea condiţie. Se activează apoi butonul ADD al câmpului OLD→NEW. În câmpul NEW VALUE se trece valoarea 3.sav) şi vom împărţi în două scorurile subiecţilor. LOWEST THROUGH din câmpul OLD VALUE şi vom trece în câmpul activat valoarea 7. Se activează prima opţiune RANGE THROUGH şi se tastează valorile minime şi maxime. În câmpul NEW VALUE se trece valoarea 2.

în câmpul din dreapta se introduc variabilele pe care dorim să le recodificăm. când am utilizat opţiunea de recodificare într-o altă variabilă: 284 . care are aceleaşi opţiuni ca în cazul opţiunii anteriore de transformare într-o variabilă diferită: Recodificare se realiză la fel ca în exemplu anterior. Trecem variabila în câmpul din dreapta: Se activează butonul OLD AND NEW VALUES. În exemplu nostru vrem să recodificăm variabil Media.LOREDANA GHERASIM În câmpul din stânga apar toate variabilele din baza de date.

PRES (Câtă încredere aveţi în preşedinte?). Se constată că s-au modificat valorile variabilei MEDIA. La itemul 2.sav) care conţine patru variabile: NRCHEST (codul de identificare). Acest lucru demonstrează că cele două opţiuni duc la acelaşi rezultat. aceasta având acum aceleaşi valori ca şi variabila NIVPERF. subiecţii au răspuns pe o scală de la 1 (foarte mult) la 4 (foarte puţin). Pentru a vedea atitudinea subiecţilor faţă de instituţiile statului ar trebui să însumăm răspunsurile subiecţilor de la cei 3 itemi.ANALIZA COMPUTERIZATĂ A DATELOR După confirmarea recodificării să vedem modificările din baza de date. Pentru a putea face 285 . Inversarea valorilor variabilelor Comanda de recodificare poate fi utilizată şi pentru recodificarea valorilor scorurilor obţinute la diferiţi itemi. însă. GUV (Câtă încredere aveţi în guvern?). Pentru a exemplifica utilizarea acestor comenzi de recodificare vom crea o nouă bază de date (baza6. PARLAM (Câtă încredere aveţi în parlament?). Pentru itemii 1 şi 3 subiecţii au răspuns pe o scală de la 1 (foarte puţin) la 4 (foarte mult). Prezentăm scorurile obţinute de 16 dintre subiecţi.

valoarea 2 să devină 3. valoarea 3 să devină 2. deci se tastează 1 în dreptul opţiunii VALUE din câmpul OLD VALUE şi cifra 4 în dreptul opţiunii VALUE din câmpul NEW VALUE. Pentru recodificare ar putea fi utilizată oricare dintre cele două opţiuni prezentate anterior RECODE INTO SAME VARIABLES sau INTO DIFFERENT VARIABLES. În final trebuie să avem următoarele transformări în câmpul OLD→NEW: 286 .LOREDANA GHERASIM acest lucru ar trebui ca răspunsurile de la itemul 2 să fie transformate. Vom redenumi variabila recodificată GUV_R: Vom activa butonul OLD AND NEW VARIABLES. iar valoarea 4 a itemului să devină 1 (ceea ce înseamnă foarte puţin). Pentru inversarea scalei de evaluare a itemului vom folosi numai opţiunile VALUE din câmpul OLD VALUE şi NEW VALUE. Apoi se tastează 2 în câmpul de la opţiunea VALUE din câmpul OLD VALUE şi cifra 3 în câmpul de la opţiunea VALUE din câmpul NEW VALUE: La fel se procedează şi pentru celelalte valori care trebuie recodificate. Astfel. pentru ca scala de evaluare să aibă aceeaşi semnificaţie cu a ceilalţi doi itemi (valoarea 1 să însemne foarte puţin iar valoare 4 să însemne foarte mult). valoarea 1 a vechii variabile devine 4 pentru noua variabilă. adică valoarea 1 a itemului să devină 4 (ceea ce înseamnă foarte mult). Se activează butonul ADD din câmpul OLD→NEW. Vom folosi comanda RECODE INTO DIFFERENT VARIABLES pentru a putea verifica dacă recodificarea a fost realizată. Recodificarea în acest caz presupune inversarea scalei de evaluare pentru itemul 2.

opţiunea COMPUTE: 3 1 2 Prezentăm caracteristicile principale ale acestei ferestre: 1. trebuie să însumăm scorurile subiecţilor obţinute la cei trei itemi.ANALIZA COMPUTERIZATĂ A DATELOR După activarea butonului CONTINUE şi butonului OK al ferestrei principale. baza de date va conţine o nouă variabilă (GUV_R) care conţine valorile inversate ale itemului 2: Comanda TRANSFORM COMPUTE Pentru a calcula scorul total la atitudinea faţă de instituţiile statului. în câmpul TARGET VARIABLE se tastează numele noii variabile 2. în acest câmp sunt prezentate variabilele din baza de date 287 . Pentru a putea face acest lucru se foloseşte meniul TRANSFORM.

288 . dar şi un câmp cu funcţii complexe care pot fi utilizate pentru calculul noilor variabile. GUV_R şi PARLAM.LOREDANA GHERASIM 3. Pentru exemplu nostru vom numi noua variabila ATIT. sub acest câmp se găsesc butoane cu cifre şi semne. în câmpul NUMERIC EXPRESSION se introduce formula de calcul a noii variabile. Variabile sunt trecute în câmpul NUMERIC EXPRESSION folosind butonul de trecere. cu numele ATIT. Semnul plus se introduce de la tastatură sau folosind butoanele care se găsesc sub câmpul NUMERIC EXPRESSION: După activarea butonului OK în baza de date apare o nouă variabila. deci vom tasta numele noii variabile în câmpul TARGET VARIABLE: Apoi vom scrie formula de calcul care va consta în însumarea scorurilor obţinute la cele trei variabile: PRES. Această nouă variabilă reprezintă atitudinea subiecţilor faţă de instituţiile statului şi reprezintă suma răspunsurilor la cei trei itemi.

Întrucât distribuţia normală este simetrică. curba normală este unimodală. Cu alte cuvinte. exact 50% din cazuri vor avea scoruri sub valoarea medie. Aproximativ 34% din cazuri se vor afla între medie şi o abatere standard la stânga sau la dreapta mediei. Există o strânsă legătură între scorurile standard (notele z) şi diferite procentaje sau frecvenţe relative. înclinarea (indică tendinţa scorurilor de a fi mai mari sau mai mici) şi turtirea (arată cât de mult variază scorurile distribuţiei). La acest test media rezultatelor este 100. Astfel. În imaginea de mai jos ilustrăm grafic această distribuţie: 34% 14% 2% Scoruri brute Scoruri z 68 -2 84 -1 100 0 34% 14% 2% 116 +1 132 +2 Dacă urmăriţi cu atenţie forma curbei normale veţi constata prezenţa unor „puncte de inflexiune”. doar aproximativ 2% dintre indivizi vor avea scoruri şi mai extreme. DISTRIBUŢIA NORMALĂ Variabilitatea rezultatelor urmează reguli care pot fi modelate matematic. să luăm drept exemplu distribuţia rezultatelor la un test de inteligenţă. Astfel. Abia 16% din populaţie vor avea scoruri mai mici sau mai mari de o deviaţie standard. iar deviaţia standard este 16. numai 16% dintre oameni au coeficientul de inteligenţă mai scăzut de 84 sau mai ridicat de 116. simetrică şi mediu turtită. Observaţi. În plus. Mai mult.ANALIZA COMPUTERIZATĂ A DATELOR III. curba normală mai posedă anumite proprietăţi speciale. Pentru a înţelege mai uşor despre ce este vorba. Există trei parametri ai unei distribuţii: modalitatea (indică valorile în jurul cărora se grupează scorurile subiecţilor). distribuţia rezultatelor se va face după o curbă normală. Din perspectiva celor trei parametri. de asemenea. Cunoscând nota Z a unui subiect putem şti cu precizie câţi indivizi din populaţie au scoruri mai 289 . că şi mai puţine cazuri sunt mai depărtate de medie. iar acest lucru poate fi demonstrat matematic. Aceste puncte corespund deviaţiilor standard. vom şti că 34% dintre subiecţi au scoruri cuprinse între medie (100) şi o deviaţie standard. vom şti că 34% dintre indivizi vor avea scorul cuprins între 100 şi 116 (cei cu IQ situat deasupra mediei) sau între 84 şi 100 (cei cu IQ situat dedesubtul mediei).1. matematicienii au pus la punct formule care permit calcularea diferitelor suprafeţe ale curbei. mai mici sau mai mari decât două deviaţii standard faţă de medie (adică sub valoarea 68 sau peste valoarea 132). Având o deviaţie standard de 16. puncte în care linia curbă îşi modifică forma. Dacă un fenomen social observat este urmărit o perioadă de timp mai îndelungată. ELEMENTE DE STATISTICĂ INFERENŢIALĂ III.

94% dintre indivizi vor avea scoruri mai mari (50%-44. după administrarea vitaminei. este precizat un procent.06%) şi 94. III. Dacă vom consulta unul din tabelele de care aminteam anterior. Deşi avem doar un singur caz pe care trebuie să îl comparăm cu o populaţie ai cărei parametri sunt cunoscuţi.06%. a început să meargă de la vârsta de 8 luni. cu o abatere standard de 3 luni? Pentru a răspunde cu dovezi statistice la o astfel de întrebare. ştiind că vârsta la care merg copii prima dată. putem calcula nota Z a acestui subiect. ipotezele trebuie reformulate în termenii generali ai populaţiilor de comparat pentru a putea face generalizarea ulterioară. ales aleatoriu din populaţie. în exemplul nostru avem de comparat două populaţii: P0 – populaţia copiilor 290 . Unul dintre efecte este scăderea vârstei la care copii încep să meargă. în populaţia normală este de 14 luni.06%) vor avea scoruri mai mici decât subiectul ales de noi.56 valoarea 44.2. care arată câţi subiecţi au scorurile cuprinse între medie şi nota Z. trebuie să facem apel la distribuţia normală a variabilei alese în cadrul populaţiei şi să respectăm anumite etape pentru verificarea raţionamentului. Farmaciştii au primit dreptul să administreze vitamina unui singur copil nou-născut. în care un grup de farmacişti a sintetizat o vitamină care accelerează procesele de asimilaţie la copii nou-născuţi. TESTUL Z Pentru a vedea cum se realizează inferenţa statistică.LOREDANA GHERASIM mici sau mai mari decât al subiectului investigat. în care se compară un eşantion format dintr-un singur caz cu o populaţie a cărei parametri sunt cunoscuţi. 1995). În acel tabel. Prezentăm în continuare curba normală corespunzătoare vârstei de debut de la care copiii încep să meargă: 34% 14% 2% 8 luni 11 luni 34% 14% 2% 14 luni 17 luni 20 luni Pentru testarea ipotezei trebuie să parcurgem mai multe etape: Etapa I: Reformularea problemei în termenii populaţiilor de comparaţie. Să presupunem că o persoană obţine la testul de inteligenţă scorul 125. testul z. pentru fiecare notă Z. Copilul respectiv. care are valoarea 1. Pot farmaciştii să susţină că vârsta precoce la care a mers copilul se datorează vitaminei. Farmaciştii au dorit să omologheze vitamina. aceştia dezvoltându-se mai rapid. Aceasta arată că doar 5.06% (50%+44. vom analiza cel mai simplu test. Aceasta înseamnă că de la medie (100) şi până la scorul nostru (125) sunt 44. ETAPELE TESTĂRII UNEI IPOTEZE. Orice manual de statistică are la sfârşit un tabel care permite calcularea acestor procentaje cu precizie. Ca exemplu vom folosi un studiu (Aron & Aron. dar pentru aceasta ei trebuie să demonstreze că într-adevăr vitamina accelerează mersul copiilor.56 (după formula: (125-100)/16). vom vedea în dreptul lui 1.06% dintre subiecţi. Astfel.

Dacă ipoteza de nul este respinsă.33) corespunzătoare probabilităţii de 1% (numită şi punct de tăiere).33 2% 8 luni 11 luni 34% 14% 2% 14 luni 17 luni 20 luni 14% Note z -2 -1 0 +1 +2 În tabelele statistice găsim valoarea scorului z (z=2. copiii din populaţia normală merg la vârsta de 14 luni.33 pentru că ne referim la scorurile mai mici decât media. cu o abatere standard de 3 luni. Etapa IV: Colectarea datelor şi transformarea lor în scoruri z. Distribuţia acestei variabile este normală.ANALIZA COMPUTERIZATĂ A DATELOR normali care nu iau vitaminele şi P1 .populaţia copiilor normali care iau vitaminele. Dacă vitamina nu ar avea nici un efect. este testată la un anumit prag de semnificaţie. la o valoare Z de 1 (adică 17 luni) se constată că 84% dintre copii merg la vârste mai mici de 17 luni. trebuie să vedem care este nota Z corespunzătoare acestuia. În cazul nostru ea va fi –2. Orice ipoteză. 34% -2. cele două populaţii de copii ar merge la aceeaşi vârstă. Această etapă presupune cunoaşterea parametrilor (media şi abaterea standard) populaţiei la care ne raportăm (în cazul nostru distribuţia copiilor care nu iau vitamina). aflate în partea stângă a curbei de distribuţie. Vom formula două ipoteze: Ipoteza de lucru (experimentală): afirmă că noii născuţi care iau vitamina vor merge mai repede decât cei care nu iau vitamina (H1: P0 < P1) Ipoteza de nul: Este ipoteza care descrie situaţia în care intervenţia noastră (vitamina) nu are nici un efect. Etapa III: Stabilirea pragului de semnificaţie şi a notei z a punctului de „tăiere”. În mod obişnuit. Am precizat anterior că fiecărui punct de pe curba de distribuţie normală îi corespunde o anumită notă standard şi o anume distribuţie a cazurilor din populaţie faţă de acel punct. una referitoare la scorurile mici (în partea stângă a distribuţiei). În cazul nostru colectarea datelor înseamnă a observa vârsta la care va merge copilul pentru prima dată (8 luni). care arată cei 1% dintre copii care merg cel mai timpuriu şi o altă valoare referitoare la scorurile mari (în partea dreaptă a distribuţiei) care arată acei 1% dintre copii care merg cel mai târziu. De exemplu. Acest prag de semnificaţie arată probabilitatea de eroare cu care noi testăm ipoteza. fără nici o altă intervenţie. Pragul de semnificaţie poate fi de 1% (când dorim să fim mai precişi) sau de 5% (atunci când putem fi mai puţin exacţi). Etapa II: Stabilirea parametrilor populaţiei de comparaţie şi a distribuţiei de comparaţie. Pentru această cercetare vom stabili un prag de semnificaţie de 1% întrucât efectele ei sunt importante. atunci putem accepta ipoteza de lucru. H0: P0 = P1 Într-o cercetare se testează de fapt ipoteza de nul pentru că ea descrie situaţia deja existentă înainte intervenţiei sau situaţia în care nu am obţine nici un efect. După stabilirea pragului. Vom transforma scorul 291 . Există două de valori Z de corespunzătoare pragului 1%. mai ales în domeniul ştiinţelor sociale. abia 16% mergând mai târziu de această vârstă. Pe noi ne interesează prima dintre aceste valori.

2. 2.8. în afară de medie va trebui să estimăm variabilitatea sa. 143. 2.3. 3. 2. 2. 2. 2-asiatică şi 3-africană).3? Deoarece nu avem acces la alţi parametri ai populaţiei. 1. 47. 3.1. 111.3. cu valorile: 1europeană. 51. Vom aplica testul t pentru a compara un eşantion cu o populaţie la care cunoaştem media.8. care are valoarea 2. 3. 102. 29. 1. 1. 3.sav). la un prag de probabilitate de 1% că vitamina lor are efectul scontat. Cu alte cuvinte. 2 Dorim să comparăm scorurile eşantionului la variabila indice demografic cu media populaţiei. 0. 1. 1. În cazul nostru. După obţinerea scorul Z corespunzător datelor colectate. 1. 4. 40. adică pentru exemplu nostru: Z=(8-14)/3)=-2 Etapa V: Compararea notei z astfel obţinută cu nota z a punctului de tăiere. III. 49. 1. 0.7.8. 2.5. 3.4. 2.1.1. 283. 2. 0. 0. 94. 2.6. 1. acceptăm ipoteza de nul.5. 0. 3.8. 63. În ipoteza noastră experimentală ne aşteptam ca nota Z corespunzătoare scorului brut să fie mai mică decât valoare Z a punctului de tăiere. 3. 1. 1.1. Media eşantionului nostru este mai mare sau mai mică comparativ cu cea a populaţiei cu valoarea 2. 1. -0. 2. -0.LOREDANA GHERASIM subiectului la variabila vârstă în scor Z. 3. 86. 124.5.2. prin raportare la distribuţia populaţiei normale de comparat folosind formula notei Z (X-M)/SD).5. 2. 2. În consecinţă.1.3. acesta trebuie comparat cu scorul Z corespunzător punctului de tăiere.4. Ipoteza de cercetare: Indicele demografic al eşantionul nostru va avea o avea o valoare diferită de indicele demografic al populaţiei Ipoteza de nul: indicele demografic al eşantionului va avea aceeaşi valoare cu cel al populaţiei Folosirea SPSS pentru compararea unui eşantion cu media unei populaţii Aplicarea testului t se face activând din meniul ANALYZE-COMPARE MERANS opţiunea ONE SIMPLE T TESTS: 292 . 2. 1. 189. 0. 188. 5.9. 80. 55. 3. Prezentăm în continuare valorile acestor variabile: dens: 94. Am prezentat testul Z pentru a înţelege logica testării ipotezelor şi înţelesul pragului de semnificaţie. 2. 1. 1.1. Vom prezenta în continuare.4. 3. 0. 1.9. 0. 1. 3.3.3. 36.1.2. farmaciştii nu au reuşit să dovedească. 0. 1. 54. 1. 2. 2. 102. Pentru a vedea cum anume se foloseşte programul SPSS în această situaţie vom crea o nouă bază de date (baza7. ind_d: 0. 3.3.8. 0. ind_d (procentul anual de creştere a populaţiei) şi dens (densitatea populaţiei pe km2). 216. 0. 81. 105.5. 79. 1. TESTUL T PENTRU COMPARAREA UNUI EŞANTION CU MEDIA POPULAŢIEI Acest test se aplică atunci când dorim să comparăm rezultatele unui eşantion cu media populaţiei (fără să avem informaţii despre varianţa rezultatelor populaţiei). 3. 2.33). 2. 3.3. 330. 800.9 reg: 1. 2.2.1. care conţine trei variabile: regiune (zona geografică.3. 2. 0. 0. 3. 27.7. 39. 221. 87. nota Z (-2) corespunzătoare scorului brut este mai mare decât a notei Z a punctului de tăiere (–2.8. 2.9. 227. 58.3. ipoteza experimentală neconfirmându-se. 36. succint testele de comparaţie cele mai frecvent folosite. 3. 1. 1.

ANALIZA COMPUTERIZATĂ A DATELOR După activarea acestei comenzi pe ecran apare următoarea fereastră: 1 3 2 Această fereastră are trei elementele importante: 1. pe ecran va apare fereastra de OUTPUT: 1 One-Sample Statistics 2 Std. câmpul în care se introduce valoarea medie a populaţiei cu care comparăm eşantionul (cu valoarea 2. Activare butonului OPTIONS duce la deschiderea următoarei ferestre: Se observă că automat calculatorul a ales un interval de încredere (CONFIDENCE INTERVAL) de 95%. 2. câmpul unde vom introduce variabilele pe care vrem să le analizăm 3. câmpul cu toate variabilele din baza de date.489 Std.3 pentru exemplul nostru). Error Mean . După activarea butonului CONTINUE şi apoi a butonului OK al ferestrei principale.189 N procentul de crestere anuala a populatiei 37 Mean 1.149 3 293 . Nu vom modifica pragul de semnificaţie. ceea ce implică un prag de semnificaţie de 5%. Deviation 1.

19≈4. (2-tailed) . prezintă pragul de semnificaţie real.001.4) corespunzător pragului de semnificaţie de 5%. σm=0. nota t a eşantionului nostru comparat la populaţia de eşantioane care are media (µm) 2. Valoarea lui t este obţinută după formula t=(m.294 df 36 Sig. celula conţine diferenţa dintre media eşantionului şi cea a populaţie la care ne raportăm. prezintă intervalul de încredere al diferenţei dintre cele două medii (-1. ONE SAMPLE TEST. indiferent dacă ele confirmă sau nu ipoteza. sunt câte elemente pe care de acre trebuie să ţinem seama: • pragul de semnificaţie: care ne indică probabilitatea de eroare atunci când respingem ipoteza de nul.428 t procentul de crestere anuala a populatiei -4.1 şi -0. conţine elemente de statistică descriptivă. Rezultatele pentru exemplul anterior sunt: Mediile: Meş=1. în cazul nostru df=36 6. Al doilea tabel. • gradul de libertate: arată care este mărimea eşantionului pe care s-a făcut testarea ipotezei.26.05 (adică eroarea nu trebuie să fie mai mare de 5%). celula cuprinde eroarea standard a mediei.19 4.LOREDANA GHERASIM One-Sample Test Test Value = 2. dar se raportează ca un p<0. Putem afirmă că 294 . care ne spune care este probabilitatea cu care greşim dacă respingem ipoteza de nul şi acceptăm ipoteza de cercetare. cu atât putem avea mai multă încredere în rezultatele obţinute. pentru a arăta că probabilitatea de a greşi este mai mică de 0. În exemplu nostru valoarea pragului de semnificaţie este 0.000 Mean Difference -. în această celulă este afişată media eşantionului. în sensul că media eşantionului nostru este semnificativ mai mică comparativ cu cea a populaţie. oricare ar fi tipul de test ales.19. • sensul diferenţei: este dat de valoarea mediilor comparate sau de semnul notei t şi arată în ce sens apare diferenţa (care medie este mai mare). Mpop=2. pragul de semnificaţie trebuie să fie mai mic sau cel mult egal cu 0. 8. Valoarea nu este identică cu cea din tabel datorită aproximărilor făcute.000. populaţie din care provine eşantionul nostru.3.49-2.4. Primul tabel. mai precis deviaţia standard a populaţiei de eşantioane de aceeaşi mărime cu al nostru (37).µ m )/ σ m =(1.3)/0. 7. 5.49 2. cuprinde gradele de liberate pentru care a fost calculată valoarea lui t şi probabilitatea de respingere a ipotezei de nul.3 95% Confidence Interval of the Difference Lower Upper -1. ONE SAMPLE STATISTICS.1% (calculatorul ne afişează doar primele trei zecimale). conţine date despre testul t propriu-zis. Pentru a confirma ipoteze de cercetare. Aceste rezultate indică faptul că diferenţa dintre medii este semnificativă. În continuare vom analiza elementele OUTPUT-ului: 1. în cazul nostru m=1. Cu cât eşantionul este mai mare. SD=1.1 3.001. În interpretarea statistică a notei t. p<0. în această celulă este afişată abaterea standard a eşantionului.29.811 4 5 6 7 8 Rezultatele sunt grupate în două tabele.3 şi abaterea standard (σm) de 0. Valoarea lui t şi pragul de semnificaţie: t(36)=-4.195 -.

153 N Numar de oameni/ kilometru patrat 37 Mean 261. Să presupunem că variabila independentă este tipul de feed-back.167 df 36 Sig. Să analizăm acum dacă scorurile la variabila densitate din eşantionul nostru diferă de cea a populaţiei cu valoarea de 0. Rezultatele indică faptul că nu există diferenţe semnificative între densitatea medie a eşantionului şi cea a populaţie. Atunci când cercetătorul împarte subiecţii în grupe în funcţie de variabila independentă. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE PERECHI În psihologia experimentală se face distincţie între grupele independente şi dependente de subiecţi. De exemplu.237 t Numar de oameni/ kilometru patrat 1. p=0. (2-tailed) .9. cu valoarea 90 (dacă am accepta ipoteza de cercetare am greşi în 25. Astfel.643 470.797 Mediile: Meş=261. avem de a face cu grupe independente de subiecţi.4. în final comparându-se rezultatele subiecţilor. cu două grade de intensitate.251 Mean Difference 171. condiţia de feed-back pozitiv şi respectiv condiţia de feed-back pozitiv. Există posibilitatea ca toate nivelurile variabilei independente să fie prezentate aceluiaşi eşantion de subiecţi. Putem spune că avem densitatea eşantionului studiat de noi este aceeaşi cu cea a populaţiei. Rezultatele testului ONE SIMPLE T TEST indică următoarele rezultate: One-Sample Statistics Std. subiecţii vor fi împărţiţi în două grupe. măsurăm nivelul anxietăţii subiecţilor înainte şi după terapie. Aceeaşi subiecţi vor trece prin toate condiţiile experimentale.797 Std.7. Subiecţii cărora le măsurăm anxietatea înainte şi după intervenţia terapeutică formează eşantioane perechi.096 One-Sample Test Test Value = 90 95% Confidence Interval of the Difference Lower Upper -126. pozitiv şi negativ. dacă variabila independentă are două grade de intensitate.16. Mpop=90 Valoarea lui t şi pragul de semnificaţie: t(36)=1. Error Mean 147.ANALIZA COMPUTERIZATĂ A DATELOR procentul de creştere a populaţie eşantionului nostru este mai mic semnificativ în comparaţie cu cel al populaţiei. Deviation 895. Subiecţii vor fi împărţiţi în două grupe.251. În această situaţie vom avea grupe perechi sau dependente de subiecţi. Nu cunoaştem nivelul mediu anxietăţii populaţie de subiecţi anxioşi înainte de a veni la terapie şi nici nivelul mediu al anxietăţii după terapie. Pentru fiecare nivel al variabilei independente vom avea câte un grup de subiecţi.1% din cazuri). pentru a vedea schimbările care apar ca urmare a intervenţiei terapeutice. Cea mai simplă situaţie de comparare a eşantioanelor este în situaţia de test-retest. Fiecare subiect va face parte dintr-un singur grup experimental. Ceea ce ştim este nivelul anxietăţii subiecţilor care au 295 . fiecărui grup prezentându-i un grad de intensitate al variabilei independente. III.

înainte şi după intervenţia terapeutică. înainte şi după terapie.sav. variabilele selectate pentru analiză. Diferenţele dintre mediile celor două eşantioane vor forma un eşantion de comparaţie. 3. pentru acest tip de test se selectează o pereche de variabile.LOREDANA GHERASIM venit la terapie. Se utilizează testul t pentru eşantioane perechi. câmpul în care se introduc cele două variabile pereche După introducerea variabilelor în câmpul de analiză fereastra ar trebui să arate astfel: 296 . Aplicarea testului t se face activând din meniul ANALYZE – COMPARE MEANS opţiunea PAIRED-SAMPLES T TEST: Odată activată comanda va apare fereastra de mai jos: 1 2 3 Prezentăm principalele opţiuni ale ferestrei: 1. pentru că avem rezultatele aceloraşi subiecţi înainte şi după terapie. câmpul din stânga cuprinde variabilele din baza de date 2. Acest eşantion al diferenţelor se compară cu o populaţie la care cunoaştem media (media are valoarea 0 conform ipotezei de nul). Ipoteza de nul: diferenţele dintre cele două măsurători sunt nule. Folosirea SPSS pentru compararea a două eşantioane perechi Pentru a demonstra modul de utilizare a testului t pentru eşantioane perechi. indică selecţia curentă. vom folosi baza de date Baza1. nu există nici o diferenţă între nivelul iniţial şi cel final al anxietăţii. ne aşteptăm ca nivelul anxietăţii după terapie să fie mai mic decât cel iniţial. Ipoteza de cercetare: susţine că vor fi diferenţe între cele două măsurători. Ceea ce ne interesează pe noi este de fapt diferenţa dintre cele două măsurători ale anxietăţii.

1.980 nivelul anxietatii ina de terapie .1865 2 1 Mean Pair 1 nivelul anxietatii inainte de terapie nivelul anxietatii dupa terapie 107. pentru fiecare dintre acestea vom analiza celulele. Error Mean 1. conţine perechea de variabile analizată. Deviation 6.025 df 19 Sig. adică să provină de la aceeaşi subiecţi şi fie cuantificate cu aceeaşi unitate de măsură 2. prezintă numărul de subiecţi din fiecare eşantion. variabilele trebuie să fie perechi. conţine deviaţiile standard a scorurilor fiecărui eşantion: Sini=60.3 297 .9. Mfin=107.270 7 10 9 8 Pair 1 Paired Samples Test 11 12 13 Paired Differences 95% Confidence Interval of the Difference Std.9000 107. conţine mediile celor două grupe analizate: Mini=107. Deviation Mean Lower Upper 8.95 3.05 anxietatii dupa tera 14 15 Rezultatele sunt organizate în trei tabele. Vom păstra intervalul de încredere de 95%.1593 t -.259 Sig. .9500 N 20 20 Std.nivelul -0.9940 2.0111 -4. N=20 4. Error Mean Std.2593 4.ANALIZA COMPUTERIZATĂ A DATELOR Butonul OPTIONS este identic cu cel de la testul t care permite compararea unui eşantion cu o populaţie. După apăsarea butonului OK fereastra OUTPUT ne va prezenta următoarele rezultate: 3 Paired Samples Statistics 4 Std. Tabelul PAIRED SAMPLES STATISTICS: 1.3062 5 6 Paired Samples Correlations N Pair 1 nivelul anxietatii inainte de terapie & nivelul anxietatii dupa terapie 20 Correlation -. (2-tailed) . Sfin=5.0166 5.3454 1.

intervenţia acţionând oarecum haotic. în cazul nostru anx1-anx2 9. Interpretarea se face în funcţie de valoarea lui t şi pragul de semnificaţie.05). coeficientul de corelaţie dintre cele două variabile pereche 7. Putem afirma că diferenţele între măsurători nu sunt sistematice. deoarece diferenţele nu sunt sistematice. indică intervalul de încredere de 95%al diferenţei dintre mediile celor două grupe 13. adică probabilitatea de eroare dacă am afirma că există o legătură între cele două variabile Tabelul PAIRED SAMPLES TESTS 8. 298 . gradele de libertate pentru care este calculată nota t. indică abaterea standard a populaţiei de eşantioane care cuprinde toate eşantioanele de aceeaşi mărime 12. pragul de semnificaţie al corelaţiei. valoarea lui t. cuprinde diferenţa medie dintre cele două grupe de subiecţi.02 14. Cei care aveau rezultate mici la prima măsurare au rezultate mici şi la a doua. Reamintim că pentru a respinge ipoteza de nul trebuie să avem cel mult 5% erori (p≤0. În exemplu nostru avem prima situaţie corelaţie nesemnificativă.980 În continuare prezentăm rezultatele obţinute în urma analizei realizată anterior: Mediile iniţiale şi finale ale subiecţilor: Mini=107. cuprinde abaterea standard a eşantionului rezultat din diferenţele celor două eşantioane 11.02. conţine numele perechii de variabile şi precizează diferenţa dintre variabile. p=0. nu numai nivelul variabilei dependente. • corelaţie negativă.LOREDANA GHERASIM 5. Avem trei situaţii posibile: • lipsa corelaţiei semnificative: în acest caz nu există o legătură între ierarhia subiecţilor la prima cu cea de al două măsurare.980.270. Valoarea negativă indică faptul că anxietatea iniţială este mai mică comparativ cu cea finală 10. adică nota t a eşantionului de diferenţe în cadrul populaţiei de eşantioane: t(19)=-0. conţine abaterile standard ale populaţiilor de eşantioane de N subiecţi din care provin eşantioanele noastre Tabelul PAIRED SAMPLES CORRELATIONS 6. p=0. df=19 15. Cei care aveau rezultate mici la prima măsurare au rezultate mari la a doua.9. Mfin=107. Subiecţii au acelaşi nivel al anxietăţii după intervenţia terapeutică. În cazul nostru se constată că nu apare o diferenţă semnificativă între nivelul iniţial şi cel final al anxietăţii (dacă am respinge ipoteza de nul am greşi în 98% din cazuri sau cu alte cuvinte valoarea lui t se plasează în zona de încredere a ipotezei de nul). iar cei care aveau rezultate mari la prima măsurare au rezultate mici la a doua măsurare. semnificativă: indică faptul că ierarhia subiecţilor se inversează de la o măsurare la alta.95 Valoarea lui t şi a pragului de semnificaţie: t(19)=-0. • corelaţie pozitivă semnificativă: indică faptul că ierarhia subiecţilor se păstrează de la o măsurare la alta. pragul de semnificaţie sau probabilitatea de eroare atunci când respingem ipoteza de nul: p=0.25. nu a îmbunătăţit starea subiecţilor. astfel că putem spune că terapia nu a avut efect. iar cei care aveau rezultate mari la prima măsurare au rezultate mari şi la a doua măsurare. Corelaţia ne arată dacă subiecţii îşi schimbă ierarhia unii faţă de alţii. ceea ce indică faptul că cele două variabile sunt independente una de cealaltă. r=-0.

variabila dependentă fiind nivelul iniţial al anxietăţii. Pentru a demonstrat modul de utilizare a testului vom folosi datele din baza de date baza1. iar grupul 2 numai din subiecţi de gen feminin). care presupune eşantioane independente de subiecţi.subiecţi de sex masculin şi 2 – subiecţi de gen feminin). 1 .5. În funcţie de variabila independentă se creează două grupe de subiecţi independenţi sau diferiţi (grupul 1 va fi format numai din subiecţii de gen masculin. câmpul cu variabilele din baza de date 2. Ipoteza de cercetare: subiecţii de sex masculin vor avea un nivel al anxietăţii iniţiale diferit de cel al subiecţilor de gen feminin Ipoteza de nul: subiecţii de gen masculin şi feminin vor avea acelaşi nivel al anxietăţii iniţiale.ANALIZA COMPUTERIZATĂ A DATELOR III. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE INDEPENDENTE Acest test se foloseşte când dorim să analizăm influenţa unei variabile independente. În acest caz variabila independentă este genul subiecţilor (cu două grade de intensitate. 299 . Fiecare subiect va putea face parte doar dintr-un singur grup. câmpul în care vom introduce variabila dependentă. opţiunea INDEPENDENT SAMPLES T TEST: Vom introduce variabila dependentă (nivelul anxietăţii înainte terapiei) în câmpul TEST VARIABLE şi variabila independentă în câmpul GROUPING VARIABLE: 1 2 3 4 Sunt trei câmpurile importante pe care trebuie să le avem în vedere: 1. Folosirea SPSS pentru compararea a două eşantioane independente Aplicarea testului t pentru eşantioane independente se face activând meniul ANALYZE – COMPARE MEANS.sav. Vom analiza dacă genul subiecţilor influenţează nivelul iniţial al anxietăţii pacienţilor. adică variabila asupra căreia dorim să analizăm influenţa variabilei independente.

celula indică variabila dependentă (nivelul anxietăţii înainte de terapie) care este analizată în funcţie de nivelurile variabilei independente (sexul subiecţilor) 2. Mgr2=110.6442 2. conţine deviaţia standard pentru fiecare grup în parte: Sgr1=2.225 -2.411 df 2. Deviation 104. Sgr2=6.2711 -10.5. 4.9753 2. în cazul nostru avem 9 subiecţi de sex masculin şi 11 de gen feminin 3.144 . Error Sig.LOREDANA GHERASIM 3.683 inainte de terap assumed Equal variance not assumed Sig.039 . butonul care permite precizarea celor două niveluri ale variabilei independente.4605 -10.8.1031 Independent Samples Test 6 7 Levene's Test for Equality of Variances t-test for Equality of Means Mean Std.3053 -.031 -5.3636 6.8571 110. câmpul unde introducem variabila independentă sau variabila de grupare (cea după care grupăm subiecţii).4747 -5. se observă că media grupului de subiecţi de gen feminin este mai mare: Mgr1=104. conţine media fiecărui grup independent. indică numărul de subiecţi din fiecare grup independent. .3 4. chiar dacă variabila independentă are mai multe grade de intensitate. (2-tailed) Difference Difference 18 13. Activarea butonului DEFINE GROUPS deschide o fereastră unde vom trece valorile corespunzătoare celor două grupuri alese pentru comparaţie (în acest caz variabila independentă are doar două niveluri 1 şi 2): În fereastra OUTPUT sunt prezentate următoarele rezultate: 1 2 Group Statistics 3 4 5 sexul subiectilor nivelul anxietatii subiecti de gen masculin inainte de terapie subiecti de gen feminin N 9 11 Std.019 t -2. se pot preciza doar două dintre acestea.5739 F nivelul anxietati Equal variance 6.9 300 . Error Mean Mean Std.5712 .8889 2.4747 5% Confidence Interv of the Difference Lower Upper -.3756 8 9 10 11 Vom prezenta succint semnificaţia datelor din tabele: 1.

4545 Std. Error ig. notat cu F.4. Deviation 4.6.05. Deci. Înainte de a analiza al doilea tabel. vom extrage nota t şi semnificaţia de pe rândul EQUAL VARIANCES NOT ASSUMED.Mgr1=104.0444 1.3434 . în funcţie de testul Levene.7805 sexul subiectilor nivelul anxietatii subiecti de gen masculin dupa terapie subiecti de gen feminin N 9 11 Mean 106. apar diferenţe semnificative între nivelul anxietăţii iniţiale a subiecţilor de gen masculin şi feminin. ceea ce indică faptul că putem respinge ipoteza de nul (care afirmă că varianţele sunt egale).0449 5. testează ipoteza de nul care afirmă că varianţele populaţiilor din care provin eşantioanele sunt egale 8. Levene. conţine pragul de semnificaţie sau probabilitatea de eroare care apare atunci când respingem ipoteza de nul şi acceptăm ipoteza de cercetare.326 dupa terapieassumed Equal varian not assumed Sig. indiferent de rândul pe care îl citim.3575 F nivelul anxie Equal varian 1. probabilitatea de eroare pentru respingerea ipotezei de nul în cazul testului Levene 9. convenţia este ca să raportăm gradele de libertate de pe primul rând (în cazul nostru df=18) 11. precizează cele două situaţii posibile în urma testării varianţei populaţiilor: varianţe egale (primul rând) sau varianţe inegale (al doilea rând) 7. Vom analiza efectul variabilei gen asupra nivelului anxietăţii subiecţilor după terapie. Interpretarea rezultatelor obţinute: Mediile: subiecţii de gen masculin . subiecţi de gen feminin . vom preciza faptul că testul LEVENE testează egalitatea varianţelor populaţiilor din care provin eşantioanele noastre.3201 -8. p=0. Concluzia este că variantele celor două populaţii sunt diferite.5309 2. Rezultatele obţinute sunt: Group Statistics Std. Putem respinge ipoteza de nul. pentru că greşim doar în 3. Pentru a respinge ipoteza de nul pragul de semnificaţie trebuie să fie cel mult egal cu 0.1111 109.2334 -8. precizează deviaţia standard pentru populaţiile de eşantioane de N subiecţi din care provin grupele noastre 6.3 Testul Levene are valoarea F=6. Testul.9% din cazuri dacă respingem ipoteza de nul. . celula conţine valorile lui t pentru varianţe egale sau inegale ale populaţiilor.031.167 -3.152 -3.1% din cazuri şi s acceptăm ipoteza de cercetare.441 df 18 -1. p=0. Subiecţii de sex masculin au un nivel al anxietăţii semnificativ mai mic comparativ cu a celor de gen feminin.2178 1.3483 1.ANALIZA COMPUTERIZATĂ A DATELOR 5. semnul lui t ne indică sensul diferenţei dintre medii.8.265 t -1.Mgr2=110. fapt de care ne putem da seama uitându-ne la valorile mediilor 10. arată gradele de libertate pentru care a fost calculată semnificaţia notei t.3434 2.9053 Independent Samples Test Levene's Test for quality of Variance t-test for Equality of Means 95% Confidence Interval of the Difference Mean Std.019. arată valoarea testului F. Greşim doar în 1.497 17. Valoarea lui t şi semnificaţia: t(18)=-2. (2-tailed Difference Difference Lower Upper .545 301 . Error Mean 1.

ANALIZA DE VARIANŢĂ . iar cealaltă parte din variaţie este produsă de abaterile fiecărui scor de la media totală a populaţiei. iar MG este salariul mediu total al tuturor salariaţilor. adică persoanele aflate în acelaşi grup să difere mai puţin între ele şi mai mult de subiecţii din celelalte grupe. mediu şi superior).3. asupra variabilei dependente. III. Pentru a distinge între grupuri ar trebui ca prima componentă a variaţiei să fie mai mică decât cea de a doua. Deci varianţele celor două populaţii sunt egale şi vom extrage rezultatele din primul rând. Să presupunem că suntem interesaţi dacă salariul românilor depinde de nivelul de studii (nivel general. Valoarea lui t este nesemnificativă (am greşi în 16. Deci nu apar diferenţe semnificative între nivelul anxietăţii bărbaţilor şi femeilor după terapie. p=0. iar distanţa b exprimă poziţia scorului x faţă de valoarea medie a populaţiei totale (formată din cele trei niveluri de studii la un loc). 302 . Distanţa a reprezintă poziţia scorului x faţă de media grupului din care aparţine. Variaţia totală a salariului populaţiei poate fi descompusă în două părţi: o parte din variaţie se datorează abaterilor fiecărui scor de la media grupului din care face parte (distanţa a).6. p=0. dar să aibă un salariu mai mare comparativ cu cei cu studii generale.ANOVA UNIFACTORIAL Se foloseşte atunci când vrem să analizăm efectul unei variabile independente. Pentru a înţelege logica acestei metode să luăm un exemplu.256) este nesemnificativ (am greşi în 26. Reprezentarea grafică a situaţiei descrisă anterior este prezentată în imaginea de mai jos: a b x M1 M2 MG M3 Cele trei linii curbe mici descriu distribuţia salariilor pentru cele trei categorii de studii. M1. t(18)=1. iar linia curbă mai mare descrie distribuţia salariului pentru toate cele trei niveluri de studii luate la un loc. care are mai mult de două grade de intensitate (sau nivele).1. Atunci când variaţia intragrup este mai mică decât variaţia intergrup înseamnă grupele sunt diferite. Mai precis ne aşteptăm ca subiecţii cu studii medii să aibă un salar mai mic comparativ cu cei cu studii. Mgr2=109.44. M2 şi M3 reprezintă salariul mediu pentru fiecare nivel de studii.5% din cazuri dacă am respinge ipoteza de nul care afirmă ă varianţele sunt egale).4 Testul LEVENE (F=1.7% din cazuri dacă am respinge ipoteza de nul şi am accepta ipoteza de cercetare).LOREDANA GHERASIM Mediile celor două grupe: Mgr1=106.167.

Ipoteza de cercetare: variabila regiune influenţează valoarea densităţii populaţie sau indicele de creştere va varia în funcţie de regiune. câmpul în care sunt afişate variabilele din baza de date. 2. 3.ANOVA unifactorial Vom folosi baza de date Baza7. indiferent de zona geografică. este câmpul în care se introduce variabila independentă sau factor (în exemplul nostru factorul este regiunea). coeficientul Fisher). câmpul în care sunt introduse variabilele dependente (în cazul nostru densitatea). Semnificaţia coeficientului F se stabileşte în funcţie de două grade de libertate: gradele de libertate intergrup (valoare dată de numărul de grupuri minus 1) şi gradele de liberate intragrup (valoare dată de suma gradelor de libertate a grupurilor sau de numărul total de subiecţi mai puţin numărul grupurilor). calculează raportul între variaţia provocată de diferenţele întergrupuri. Folosirea SPSS .ANALIZA COMPUTERIZATĂ A DATELOR Analiza de varianţă (simbolul este F. MSB. Ipoteza de nul: indicele de creştere (densitatea) va avea aceeaşi valoare. 303 . 2-asiatică şi 3-africană) asupra indicelui de creştere al populaţie. opţiunea ONE WAY ANOVA: Vom introduce variabila dependentă (procentul de creştere al populaţie) în câmpul DEPENDENT LIST şi variabila independentă în câmpul FACTOR: 2 1 3 4 6 5 Să analizăm fereastra: 1. şi variaţia cauzată de diferenţele intragrup.sav şi vom analiza efectul variabilei regiune (care are trei grade de intensitate: 1-europeană. Pentru realizarea acestei analize se deschide meniul ANALYZE – COMPARE MEANS. MSW. (formula de calcul este F=MSB/MSW) şi stabileşte dacă acest raport este suficient de mare pentru a putea distinge între grupe.

Activarea butonului descriptiv deschide următoarea casetă: Opţiunile pe care le vom bifa sunt DESCRIPTIV pentru a vedea mediile celor trei grupe şi reprezentarea grafică a efectului MEANS PLOT. Vom descrie pe scurt opţiunile butonului POST-HOC: Toate testele de la această opţiune indică dacă diferenţele obţinute pe ansamblu prin analiza testului F se regăsesc şi la nivelul comparaţiilor dintre grupuri luate două câte două. Testele sunt prezentate în ordinea descrescătoare a puterii lor. Deviation .693 1. Pragurile de semnificaţie a acestor teste sunt ajustate în funcţie de numărul de grupe. 5. 6.376 .LOREDANA GHERASIM 4.956 . butonul POST HOC permite alegerea unui anumit tip de contrast post-hoc. După activarea butonului OK al ferestrei principale în foia cu rezultate apr următoarele tabele: Descriptives procentul de crestere anuala a populatiei N europa asia africa Total 15 11 11 37 Mean .489 Std.433 1. Pentru a analiza efectul variabilei independente asupra celei dependente se foloseşte testul BONFERRONI.724 2.564 1. butonul CONTRAST permite realizarea unor comparaţii între grupe în funcţie de variabila independentă.149 304 . butonul OPTIONS conţine elemente de statistică descriptivă.

290* . conţine valoarea testului F obţinută prin împărţirea mediei varianţei intragrup la media varianţei intergrup (în exemplul nostru: 16. 4. 8.05 level.000 1. iar cel intragrup este 34 (numărul total de subiecţi este 37 minus 3 numărul de grupe).257 africa -. Coloana este notată cu I.939 . prima coloană indică nivelul de referinţă al variabilei independente.ANALIZA COMPUTERIZATĂ A DATELOR 1 2 Sum of Squares 33. în a doua coloană sunt trecute deviaţiile pătratice care intră în componenţa fiecărui tip de varianţă (intergrup şi intragrup).277 africa europa 2.642 . gradul de libertate intergrup (sau between) este 2 (3 grupe-1). în această coloană sunt prezentate gradele de libertate pentru care se calculează valoarea prag a lui F. Pentru a vedea diferenţele dintre grupuri trebuie să analizăm rezultatele prezentate în tabelul POST HOC TESTS: 7.34)=39. 9.630 .969* . Din datele pe care le avem până acum.257 africa -2. Lower Bound Upper Bound .273 . 305 .564 ANOVA procentul de crestere anuala a populatiei df 2 34 36 Mean Square 16.273 1. coloana afişează valorile diferenţelor dintre coloana I şi J. Coloana este notată cu J.666 -. 6.5).004 -1. Error europa asia -1. în această coloană sunt prezentate componente ale testului F.000 -2.000 .000 Between Groups Within Groups Total 3 4 Multiple Comparisons 5 6 Dependent Variable: procentul de crestere anuala a populatiei Bonferroni 7 8 9 11 95% Confidence Interval Sig.5. conţine semnificaţia testului F sau probabilitatea de eroare când respingem ipoteza de nul. fără a preciza care sunt grupele între care apar diferenţe semnificative. putem concluziona că pe ansamblu.4=39.666 10 Mean Difference (I) regiunea geografic (J) regiunea geografic (I-J) Std. în prima coloană sunt trecute cele două componente ale variaţiei totale: cea intergrup şi intragrup. Vom prezenta succint semnificaţia datelor din tabele: 1.421 F 39. F(2.939 -.6/0.001.259* . 2. regiunea influenţează valoarea indicelui demografic.261 14. faţă de care se face comparaţia.259* . coloana a doua indică nivele variabilei independente care sunt comparate cu nivelurile de referinţă.611 . p<0.642 1.000 -1.257 asia europa 1.908 .908 -1. .004 .257 asia . The mean difference is significant at the . 5.969* .277 *.611 2. 3. Putem spune că doar pe ansamblu se întâmplă acest lucru pentru că rezultatele analizei ANOVA se referă doar la existenţa diferenţelor globale dintre grupe.303 47.290* .532 Sig.

2. .638 756166.004 Între toate grupele apa diferenţe semnificative. urmează apoi regiunea asiatică (indicele este semnificativ mai mare decât cel al regiunii europene.142 Between Groups Within Groups Total 306 .057 F 2. dar mai mici decât cel al regiunii africane). în exemplul nostru observăm următoarele rezultate: Mgr1(Europa)-Mgr2(Asia)=-1. p<0. Rezultatele obţinute sunt următoarele: ANOVA Numar de oameni/ kilometru patrat Sum of Squares 3133461 25709646 28843107 df 2 34 36 Mean Square 1566730. Astfel.LOREDANA GHERASIM 10. cea mai mare valoarea a indicelui demografic îl are regiunea africană (indicele este semnificativ mai mare comparativ cu celelalte două regiuni).072 Sig. p=0.96. coloana conţine valoarea exactă a pragului de semnificaţie pentru fiecare diferenţă.2. steluţa care apare în dreptul diferenţelor dintre medii indică existenţa unor diferenţe semnificative între acestea. p<0.001 Mgr1(Europa)-Mgr3(Africa)=-2.001 Mgr2(Asia)-Mgr3(Africa)=-0. 11. Pe ultimul loc se plasează Europa cu cel mai mic (semnificativ mai mic comparativ cu zona asiatică şi africană) indice demografic. În imaginea de mai jos apare grafică a efectului: În continuare vom analiza efectul variabilei regiune asupra densităţii.

8. 1. 1. 2. Prezentăm mai jos datele care trebuie introduse în programul SPSS: Nota: 9. 1. 6. . 9. 2. 7.234 . 2. 8 Niv_stim: 1. 2.789 Sig.2% din cazuri). 1. 1. 1. 1.234 1. 1. la fel coeficientul F măsoară raportul dintre variaţia cauzată de împărţirea pe grupuri şi variaţia intrinsecă a grupurilor. Efectele de interacţiune măsoară influenţa combinată a două sau mai multor variabile independente asupra variabilei dependente. 2. 2 Niv_anx: 1. 1.172 -648.000 . 2 307 . Metodele prezentate până acum (testele t şi ANOVA unifactorial) permit doar evidenţierea influenţei separate a fiecărui factor.nivel scăzut al stimei de sine şi 2 – nivel ridicat al stimei de sine). 2. 2. p=0. Testul POST HOC Bonferroni nu semnalează diferenţe semnificative între cele trei grupe care se formează în funcţie de intensităţile variabilei independente. 1. 2.1. 2. indiferent de acţiunea celorlalte variabile independente. 1. 6. cu două valori: 1 . Deci. 2. 7.268 Din tabelul ANOVA extragem valoarea şi semnificaţia lui F: F(2. 1.447 648. 2. niv_anx (nivelul de anxietate cu două valori: 1 . Constăm nu există un efect al variabilei regiune asupra densităţii populaţiei (nu putem respinge ipoteza de nul pentru că am greşi în 14.268 1. 1. Acest tip de analiză prezintă două tipuri de note F corespunzătoare celor două tipuri de efecte pe care le măsoară. 2. 1. 1.142. 10. 5. densitatea populaţiei este aproximativ aceeaşi indiferent de regiune: europeană. 2. 1. 8.07. 2. 2.789 345. 7. 1.186 345.34)=2. 9.7. 2. niv_stim (nivelul stimei de sine.ANALIZA COMPUTERIZATĂ A DATELOR Multiple Comparisons Dependent Variable: Numar de oameni/ kilometru patrat Bonferroni Mean Difference (I-J) -627. 5. 2. 1. 8. 9. 2. Error 345.GENERAL LINEAR MODEL . 5. 7. 2. 8. Pentru a analiza efectelor mai multor variabile independente se poate folosi analiza de varianţă factorială. 8.186 345.UNIVARIATE Pentru a prezenta modul de folosire al programului SPSS pentru aplicarea acestei metode vom crea o nouă bază de date (baza8. 2. 1. 1.nivel scăzut de anxietate scăzut şi 2 nivel ridicat de anxietate). 2. 2. 8. 2. 1. 1. 7. 1. 2. 1. 2. 5. 2.618 (I) regiunea geografica europa asia africa (J) regiunea geografica asia africa europa africa europa asia Std.186 370. 6. ANOVA UNIVARIATE Cele mai multe studii realizate în domeniul psihologiei studiază efectul mai multor factori (variabile independente) asupra uneia sau mai multor variabile dependente. 7. 6. Folosirea SPSS . asiatică sau africană. Logica acestei metode este identică cu a modelului ANOVA unifactorial.186 370. 7. 1.sav) care conţine trei variabile: nota (notele obţinute de studenţi la examen). 10. 10. 1.447 21.618 -21. III. 6. Efectele principale măsoară influenţa unei variabile independente asupra variabilei dependente. 1.172 627.000 . 8. 1. 2. 1.

LOREDANA GHERASIM În acest exemplu avem două variabile independente niv_stim (nivelul stimei de sine) şi niv_anx (nivelul de anxietate). care nu ne interesează în mod direct sau a căror acţiune nu o putem controla 5. Odată activată comanda pe ecran apare următoarea fereastră: 2 3 1 4 5 6 Vom explica această fereastră: 1. Pentru analiza efectului combinat voma activa meniul ANALYZE . 6. fiecare din ele având două grade de intensitate.GENERAL LINEAR MODEL opţiunea UNIVARIATE. se poate introduce o singură variabilă dependentă 3. aici se trec valorile pe care le putem folosi atunci când bănuim că unele variabile independente (factori) ar corela între ele. este o opţiune pentru utilizatorii avansaţi şi nu recomandăm folosirea metodei fără cunoaşterea precisă a semnificaţiei sale. Pentru exemplul nostru. în câmpul FIXED RACTOR se introduc variabilele independente (sau factorii) a căror efect este controlat (nu este cauzat de întâmplare) 4. în câmpul RANDOM FACTOR pot si trecute variabilele independente. deci vom trece aceste variabile în câmpul FIXED FACTORS. în câmpul COVARIATE pot fi trecute variabile independente sau variabile dependente care ar putea avea o legătură sau un efect asupra variabilei dependente. Variabila dependentă este NOTA (vom trece această variabilă în câmpul DEPENDENT VARIABLE: 308 . Vom analiza efectul de interacţiune (sau combinat) al nivelului de anxietate şi al stimei de sine asupra notei obţinute la examen. astfel vom vedea dacă variabilele noastre independente (trecute în câmpul FIXED FACTORS) influenţează variabila dependentă indiferent de acţiunea factorilor covarianţi. Variabila dependentă este nota obţinută la examen. variabilele independente sunt nivelul stimei de sine (NIV_STIM) şi nivelul anxietăţii (NIV_ANX). conţine variabilele din baza de date 2. în câmpul DEPENDENT VARIABLE se introduce variabila dependentă.

opţiunea CUSTOM se foloseşte dacă se doreşte simplificarea modelul cu care se lucrează. folosind opţiunile care se deschid din câmpul INTERACTION. putem alege efectele pe care vrem să le analizăm. acestea putând fi folosite pentru design-uri experimentale mult mai complexe. ceea ce înseamnă că se vor lua în calcul toate efectele principale şi combinaţiile posibile de factori. Precizăm nu vom folosi în analiză toate opţiunile.ANALIZA COMPUTERIZATĂ A DATELOR În partea dreaptă fereastra principală există o serie de butoane care conţin opţiuni complexe de analiză. 309 . cu ajutorul butonului cu săgeată se pot selecta factorii pentru care dorim să se calculeze efectele. bifarea acestei opţiune activează automat câmpurile şi butoanele care se găsesc dedesubt. Butonul MODEL activează următoarea fereastră: 2 1 3 4 Opţiunile din această fereastră folosesc la construirea unor modele de analiză în condiţiile în care situaţia investigată este complicată (conţine multe variabile independente). opţiunea FULL FACTORIAL este marcată implicit. Să analizăm fereastra: 1. permiţând calculul anumitor efecte pentru anumiţi factori 3. Pentru modelele simple se recomandată utilizarea acestei opţiuni 2.

Butonul CONTRAST deschide următoarea fereastră: Opţiunile acestei ferestre permit compararea diferitelor grupuri rezultate din împărţirea subiecţilor în funcţie de valorile sau categoriile variabilelor independente. La fel se procedează şi pentru variabila independentă nivelul anxietăţii. 310 . Prin tipul de contrast DIFFERENCE. Se alege variabila independentă pentru care se doreşte calculul contrastul (diferenţa dintre nivelele sale de variaţie). După alegerea tipului de contrast trebuie activat butonul CHANGE. vom păstra opţiunea marcată implicită FULL FACTORIAL.LOREDANA GHERASIM 4. Apoi. permite alegerea tipului de interacţiune dintre variabilele independente (cât de complexă să fie interacţiunea) şi calculul unor coeficienţi de regresie ai modelului (există o legătură strânsă între Regresia liniară şi analiza de varianţă). Cu alte cuvinte vom vedea dacă cei cu stimă de sine ridicată obţin note diferite de cei cu stimă de sine scăzută). Pentru exemplificare. Pentru exemplul nostru. Se apasă butonul CONTINUE pentru a reveni la fereastra principală. se cere programului să analizeze dacă între cele două nivele ale variabilei nivel al stimei de sine vor apărea diferenţe în ceea ce priveşte notele obţinute. Aici sunt trecute doar variabilele independente. se alege tipul de contrast din câmpul CONTRAST. Se recomandă tipul de contrast DIFFERENCE. am ales variabila NIV_STIM (nivelul stimei de sine).

În consecinţă vom reprezenta notele la examen în funcţie de nivelul stimei de sine.ANALIZA COMPUTERIZATĂ A DATELOR Butonul PLOTS activează o fereastră dedicată reprezentărilor grafice: Pe axa HORIZONTAL AXIS se introduce variabila independentă ale cărei categorii dorim să le reprezentăm pe axa X. SEPARATE PLOTS se foloseşte introducerea celui de al treilea factor. care indică relaţia dintre variabilele introduse anterior pentru fiecare nivel al factorului trei. Pe axa SEPARATE LINES se introduce variabila pentru care se vor trasa linii ce vor reprezenta categorii diferite ale factorului. ca în imaginea de mai jos: 311 . NIV_ANX (reprezentată prin linii separate). NIV_STIM (pe care o vom trece pe axa X) şi nivelul anxietăţii. ceea ce permite obţinerea mai multor grafice. În exemplul nostru avem doar doi factori.

Vom reveni la fereastra principală fără a activa vreo opţiune. Această opţiune se foloseşte doar când variabile independente au mai mult de două nivele de variaţie. Nu vom mai comenta aceste opţiuni. deoarece ambele variabile independente au doar două nivel. Revenim din nou în fereastra principală pentru a activa butonul POST HOC care va deschide fereastra: Acest buton are opţiuni similare cu butonul POST HOC din fereastra ANOVA ONE-WAY. Acest buton permite realizarea mai multor grafice. deoarece în urma activării acestuia câmpurile ferestrei se golesc. Pentru a analiza diferenţele dintre grupe se foloseşte testul Bonferroni. Butonul SAVE activează următoarea fereastră: Opţiunile la care face referire acest buton se referă la o altă metodă statistică numită Regresia liniară. Butonul OPTIONS activează o fereastră specifică acestei analize de varianţă: 312 . Pentru exemplul nostru nu avem nevoie de comparaţii POST HOC.LOREDANA GHERASIM Se activează butonul ADD. dar menţionăm că ele facilitează tratarea analizei de variantă ca un model particular de regresie. Recomandăm folosirea acestor opţiuni doar celor care cunosc regresia.

permiţând calcularea mediei pentru fiecare grup de subiecţi în parte. ne interesează calculul parametrilor descriptivi (media. Primele elemente ale output-ului se referă la parametrii descriptivi ai modelului.ANALIZA COMPUTERIZATĂ A DATELOR 2 1 3 Prezentăm elementele principale ale ferestrei: 1. De exemplu. minimul şi maximul). este câmpul în care se trec factorii pentru care dorim să calculăm mediile grupurilor de subiecţi 3. Dintre toate. 313 . Primul tabel precizează numărul de subiecţi pentru fiecare grup obţinut în funcţie de nivelurile fiecărei variabile independente. prezintă opţiuni ce permit calcularea mai multor parametri. neîmpărţiţi în grupuri 2. Opţiunea OVERALL se referă la media calculată pentru toţi subiecţii. După selecţia opţiunilor fereastră arată astfel: În continuare vom prezenta foaia cu rezultate. deviaţia standard. sunt 16 subiecţi în grupul celor cu nivel scăzut al stimei de sine. prezintă toate combinaţiile de factori pentru care avem grupuri diferite de subiecţi. precum şi testele de omogenitate (care trebuie să nu fie semnificative pentru a putea aplica acest model ANOVA).

LOREDANA GHERASIM

Al doilea tabel precizează mediile totale precum şi cele corespunzătoare fiecărui subgrup de subiecţi, subgrup determinat de categoriile factorilor din model. Aceste date sunt rezultatul opţiunilor marcate de noi din fereastra butonului OPTIONS.

Mai departe, în foaia de rezultate sunt prezentate elementele cele mai importante ale outputului, rezultatele testului F.

Tabelul cu testul lui Levene reprezintă tocmai testul de omogenitate, care trebuie să fie nesemnificativ pentru a utiliza această metodă.
4 2 3

1

Cele mai importante elemente ale tabelului se referă la testul F. Ne interesează numai liniile marcate prin acolade. 1. arată variabilele ale căror efecte le luăm în calcul:

314

ANALIZA COMPUTERIZATĂ A DATELOR

linia cu NIV_STIM arată efectul principal al factorului nivelul stimei de sine, indiferent de acţiunea celuilalt factor; • NIV_ANX arată efectul principal al factorului nivel de anxietate, indiferent de acţiunea celuilalt factor; • linia NIV_STIM*NIV_ANX se referă la efectul de interacţiune al celor două variabile asupra variabilei dependente; 2. conţine notele F corespunzătoare efectelor principale şi de interacţiune; 3. conţine pragurile de semnificaţie ale testelor F. 4. conţine gradele de libertate between subjects şi within subjects Pentru exemplu nostru s-a obţinut doar un singur F semnificativ (p<0,05) şi anume cel corespunzător liniei NIV_STIM (F(1,30)=22,13, p<0,001). Deci apare un efect principal al variabilei nivelul stimei de sine asupra notelor la examen. Restul efectelor sunt nesemnificative. Nu apare un efect principal al variabilei nivelul anxietăţii (F(1,30)=2,7, p=0,107), deci notele subiecţilor nu depinde de cât de anxioşi sunt aceştia. De asemenea, nu apare un efect de interacţiune al variabilelor independente nivelul stimei de sine şi nivelul anxietăţii (F(1,30)=0,02, p=0,881), deci nota la examen nu este influenţată de efectul combinat al nivelului de anxietate şi al stimei de sine. Pentru a vedea modul în care nivelul stimei de sine (NIV_STIM) influenţează nota la examen, trebuie să ne uităm în tabelul de contrast: Testul de contrast calculează diferenţa între media notelor obţinute de subiecţii cu nivel ridicat al stimei de sine şi a celor cu nivel scăzut al stimei de sine (LEVEL 2 vs. LEVEL l). Această diferenţă a fost comparată cu situaţia în care cele două grupuri ar fi obţinut valoarea zero (HYPOTHESIZED VALUE). Pragul de semnificaţie (notat cu SIG) indică apariţia unei diferenţe semnificative. Sensul diferenţei (-1,93) indică faptul că cei cu nivel ridicat al stimei de sine (LEVEL 2) au obţinut note mai semnificativ mai mici comparativ cu cei cu nivel ridicat al stimei de sine (LEVEL 1). Tabelul alăturat reia analiza contrastelor pentru factorul nivelul anxietăţii: Aici nu mai apar diferenţe semnificative (fapt confirmat şi de lipsa unui efect principal pentru această variabilă), deci nivelul anxietăţii nu afectează nota la examen (Mdif=-0,68, p=0,107). Următoarele tabelele prezintă media obţinută pe ansamblu (tabelul l), mediile obţinute pentru fiecare factor în parte (tabelele 2 şi 3) şi cele pentru grupurile de subiecţi rezultat al combinării nivelurilor celor două variabile independente. Aceste tabele ajută la interpretarea sensului diferenţelor la testele de
315

LOREDANA GHERASIM

contrast şi interacţiunii variabilelor. Tabelele prezintă şi deviaţiile standard şi limitele valorii medii pentru un interval de încredere de 95%.

La finalul foii de rezultate apare reprezentarea grafică a interacţiunii dintre variabilele independente:

Liniile graficului reprezintă nivelurile diferite de anxietate. Efectul principal al variabilei NIV_STIM poate fi observat grafic cu uşurinţă: notele obţinute de subiecţii cu stimă de sine ridicată au valoare mai mică comparativ cu cei care au stimă de sine scăzută. Putem concluziona, pentru exemplul nostru, că nota la examen este influenţată de nivelul stimei de sine dar nu şi de nivelul anxietăţii. Mai mult, nivelul stimei de sine acţionează asupra notei la examen în acelaşi mod indiferent de nivelul anxietăţii.

316

103. Scopul cercetării ar putea fi analiza eficienţei intervenţiilor terapeutice asupra nivelului anxietăţii. 1 – pretest (înainte terapiei) şi 2 posttest (după terapie). Efectele de interacţiune măsoară influenţa combinată a două sau mai multor variabile independente asupra variabilei dependente.ANALIZA COMPUTERIZATĂ A DATELOR III. se formează o nouă variabilă independentă. 105. 109. 106. 105. TERAPIE: 1. Prezentăm mai jos datele. 2. cu două valori care corespund celor două tipuri de intervenţii terapeutice 1. 112. 1. Activarea comenzilor pentru acest model ANOVA se face din meniul ANALYZE . cu măsurări repetate. 106. 103. 2. Cu alte cuvinte trebuie denumită variabila independentă care presupune măsurări repetate şi trebuie precizate nivelurile acesteia. 115. trebuie să utilizăm un alt model de analiză de varianţă. 115.sav) care conţine trei variabile: ANX1 (scorurile pacienţilor la scala de anxietate înaintea terapiei.GENERAL LINEAR MODEL opţiunea REPETED MEASURES. ANX2 (scorurile pacienţilor la scala de anxietate după terapie). 1. 2. 104. pe ecran apare fereastra alăturată: Pentru a putea face analiza trebuie definită variabila care presupune măsurări repetate. 1. Această variabilă independente se referă la momentul măsurării anxietăţii pacienţilor şi are două niveluri. 112. 110. 1. 2 Variabila dependentă este reprezentat de scorurile obţinute la scala de măsurare a anxietăţii înainte şi după terapie. 103. 104. 117.tip 1 de terapie şi 2 . 2. 1. 110.tip 2 terapie). La fel ca şi modelul de varianţă prezentat anterior şi acest tip de analiză prezintă două tipuri de note F corespunzătoare tipurilor de efect măsurate. 116. 2. pe care o vom denumit TRT. 124. 104. 102. indiferent de acţiunea altei variabile independente. Efectele principale măsoară influenţa fiecărei variabile independente asupra variabilei dependente. şi anume modelul ANOVA cu măsurări repetate. 104. Acest model de analiză de varianţă se utilizează atunci când se doreşte analiza efectului de interacţiune a două variabile independente. care trebuie introduse în programul SPSS: ANX1: 109. care apare în câmpul WITHIN-SUBJECTS FACTOR NAME (factor 1) vom trece numele noii variabile 317 . 102. 105. 2. în cazul nostru această variabilă este măsurarea repetată a anxietăţii înainte şi după terapie (sau test-retest). 103. 110. În locul denumirii generice a variabilei care presupune măsurări repetate. 1. 121. 102. ANX2: 110. 102. 2. şi TERAPIE (tipul de terapie utilizat. 115. 102. 2. 110. 2. 102. 109. Pentru a analiza efectul terapiei asupra stării pacienţilor trebuie să comparăm nivelul iniţial şi cel final al anxietăţii pacienţilor. 1. 1. Folosirea SPSS . După activarea comenzii. 2. iar cealaltă măsurări repetate. Astfel. 104. 108.8. Atunci când una dintre variabilele independente presupune eşantioane perechi sau măsurări repetate. Variabila independentă tip de terapie (TERAPIE) are două nivele (tip 1 de terapie şi tip 2 terapie) şi presupune eşantioane independente. ANOVA REPETED MEASURES Modelul ANOVA UNIVARIATE prezentat anterior permite analiza efectului de interacţiune a două variabile independente care presupun grupe independente de subiecţi. 110.GENERAL LINEAR MODEL – REPETED MEASURES Pentru a prezenta modul de utilizare a programului SPSS pentru aplicarea acestei metode vom crea o nouă bază de date (baza 8. una presupunând eşantioane independente. 104.

această variabilă presupunând grupe independente de subiecţi şi reprezentând variabila factor. 3. 4. în acest câmp introducem variabilele independente care presupun eşantioane independente.LOREDANA GHERASIM TRT. aici se introduc variabilele care reprezintă niveluri ale variabilei independente cu măsurări repetate. În câmpul NUMBER OF LEVEL trebuie trecut numărul de măsurători repetate. Pentru exemplul nostru vom trece valoarea 2 pentru că anxietatea este măsurată înainte şi după terapie (vezi imaginea din dreapta): Se activează butonul ADD. 318 . În cazul nostru variabilele ANX1 şi ANX2 reprezintă nivelurile variabilei TRT. în consecinţă aceste variabile se introduc în câmpul WITHIN-SUBJECTS VARIABLES (TRT). Variabila tip de terapie (TERAPIE) se introduce în câmpul BETWEEN-SUBJECTS FACTOR. 2. este câmpul ce conţine variabilele din baza de date. pentru a putea utiliza metoda şi defini variabilele independente (vezi imaginea din stânga): După salvarea definirii factorului cu măsurări repetate se activează butonul DEFINE. care activat deschide o nouă fereastră: 2 1 3 4 Vom prezenta câmpurile acestei ferestre: 1. se introduc variabile independente sau dependente care ar putea avea legătură sau ar influenţa variabila dependentă.

Butonul CONTRAST activează următoarea casetă de dialog: 319 . Butonul MODEL activează următoarea fereastră: Opţiunile din această fereastră folosesc la construirea unor modele în condiţiile în care situaţia investigată este prea complicată.ANALIZA COMPUTERIZATĂ A DATELOR În partea de jos a ferestrei principale apar o serie de butoane care conţin opţiuni complexe de analiză. Opţiunile sunt similare celor care au apărut în modelul de analiză de varianţă prezentat anterior ANOVA UNIVARIATE. vom păstra opţiunea selectată implicit FULL FACTORIAL. ceea ce va însemna că în foia cu rezultate vor apărea atât efectele principale ale celor două variabile independente cât şi efectul de interacţiune al acestora. Pentru exemplul nostru.

Pentru exemplul nostru nu avem nevoie de comparaţii POST-HOC. Vom selecta tipul de contrast Difference. Trebuie să alegem tipul de contrast pentru variabila TERAPIE. Vom reprezenta nivelul anxietăţii pacienţilor în funcţie de tipul terapiei (pe care o vom trece pe axa X) şi momentul evaluării anxietăţii TRT (reprezentată prin linii separate): Se activează apoi butonul ADD pentru ca aplicaţia SPSS să reţină reprezentarea grafică a interacţiunii dintre variabilele independente: Butonul POST HOC deschide următoarea fereastră: Acest buton are opţiuni similare butonului POST HOC din fereastra ANOVA ONE-WAY şi UNIVARIATE. pentru a analiza diferenţele dintre grupe se foloseşte testul Bonferroni. De asemenea. Butonul PLOTS activează o fereastră dedicată reprezentărilor grafice. În consecinţă. vom reveni la fereastra principală fără a activa vreo opţiune. Opţiunea se foloseşte atunci când variabile independente au mai mult de două nivele de variaţie. pentru că variabilele independente au dor două niveluri.LOREDANA GHERASIM Se observă că deja este selectat tipul de contrast pentru variabila independentă care presupune măsurări repetate (TRT Polynomial). 320 . care presupune două niveluri.

Recomandăm folosirea acestor opţiuni doar celor care cunosc regresia. În continuare vom prezenta foaia cu rezultate.ANALIZA COMPUTERIZATĂ A DATELOR Butonul SAVE activează următoarea fereastră: La fel ca la ANOVA UNIVARIATE. 321 . facilitând tratarea analizei de variantă ca un model particular de regresie. butonul se referă la o altă metodă statistică numită Regresia liniară. Butonul OPTIONS activează o fereastră specifică analizei de variantă: La OPTIONS avem posibilitatea de a cere calculatorului să ne afişeze mediile grupelor de subiecţi în funcţie de fiecare variabilă independentă. precum şi în funcţie ambele variabile. deci pentru fiecare grup experimental. Primul tabel precizează nivelurile (ANX1 şi ANX2) variabilei cu măsurări repetate (TRT). Al doilea tabel precizează numărul de subiecţi pentru fiecare grup obţinut în funcţie de nivelurile factorului care presupune eşantioane independente: Următorul tabel precizează mediile pentru fiecare subgrup de subiecţi format în funcţie de toate categoriile factorilor din model. Primele elemente ale output-ului se referă la parametrii descriptivi ai modelului.

De asemenea.006.23. pacienţii care au primit tipul 2 de terapie au un nivel al anxietăţii semnificativ mai ridicat comparativ cu pacienţii care au primit terapia de tip 1 (Mdif=4. p=0.18)=0.002). La fel ca şi la modelul de analiză de varianţă anterior se extrag valorile coeficienţilor F. 322 .267. nu apare un efect combinat al variabilelor independente. Astfel. p=0. indiferent de tipul de terapie utilizat. Deci subiecţii au acelaşi nivel al anxietăţii înainte şi după terapie. TRT*TERAPIE (F(1. Următorul tabel indică efectul variabilei independente tip de terapie. fără a ţine seama de momentul măsurării F(1. ceea ce indică faptul că nivelului iniţial al anxietăţii pacienţilor nu diferă de nivelul final al anxietăţii pacienţilor după terapie (F(1.050). pragul de semnificaţie şi gradele de libertate.661). p=0.40.LOREDANA GHERASIM Următoarele două tabele prezintă efectele principale şi de interacţiune ale variabilelor independente.18)=0. În primul tabel se constată că nu apare un efect al variabilei TRT (p>0. Pentru a vedea cum influenţează tipul de terapie nivelul anxietăţii pacienţilor vom analiza tabelul Custom Hypothesis.002. Faptul că subiecţii au acelaşi nivel al anxietăţii după intervenţia terapeutică indică faptul că terapia utilizată nu a avut efect.18)=13. p=0.940). Se constată că apare un efect principal al acestei variabilei independente asupra nivelului anxietăţii pacienţilor după terapie.

Tabelele prezintă şi deviaţiile standard şi limitele valorii medii pentru un interval de încredere de 95%. mediile obţinute pentru fiecare factor în parte (tabelele 2 şi 3) şi pentru grupele de subiecţi obţinute în urma combinării nivelurilor celor două variabile independente (tabelul 4). Aceste tabele ajută la interpretarea sensului diferenţelor la testele de contrast şi interacţiunii variabilelor.ANALIZA COMPUTERIZATĂ A DATELOR Următoarele tabelele prezintă media obţinută pe ansamblu (tabelul l). 323 . La finalul foii de rezultate apare reprezentarea grafică a interacţiunii dintre variabilele independente: Liniile graficului reprezintă momentele măsurării anxietăţii. Efectul principal al variabilei TERAPIE poate fi observat grafic cu uşurinţă.

GEN (genul subiecţilor.deloc mulţumit. pot fi uşor detectate diferenţele folosind metodele parametrice. Prezentăm scorurile subiecţilor la cele patru variabile: 324 . 5-foarte mult". fără a intra în detaliile teoretice privind aceste teste.1. Folosirea SPSS Pentru a demonstrat modul de aplicare a acestei metode vom crea o nouă bază de date (baza9. IV. este mai indicată măsurarea pe o scală de interval de tipul „1-deloc -2-3-4-5 . cu două valori: 1 indicând persoanele care au votat pe Geoană. nu mai pot fi utilizaţi. 4-mult. aceste metode pot eşua mai uşor în demonstrarea diferenţele.puţin mulţumit şi 3 . recomandăm conceperea instrumentelor utilizând scalele de interval în locul celor nominale sau ordinale. TESTUL CHI PĂTRAT Testul chi-pătrat permite compararea distribuţiei frecvenţelor unei variabile pe mai multe categorii. Testul compară abaterile de la această distribuţie teoretică obţinute în realitate şi estimează probabilitatea ca ele să apară aleatoriu.foarte mulţumit). Metodele statistice utilizate pentru analiza acestor date sunt numite teste neparametrice. iar 2 indicând pe cei care au votat Băsescu) şi variabila GR_MULT (conţine răspunsurile subiecţilor la întrebarea „Cât de mulţumiţi sunteţi de situaţia actuală a ţării?”. deoarece nu există restricţii cu privire la distribuirea normală a rezultatelor. Totuşi. parametrii obişnuiţi pe care i-am folosit până acum în analiză. Aplicarea acestor teste este mai facilă decât folosirea testelor parametrice. Din acest motiv. În acest fel. prin raportare la o distribuţie teoretică stabilită de cercetător.LOREDANA GHERASIM IV. Vom prezenta câteva dintre metodele neparametrice. cu două valori: 1 . DATELE NEPARAMETRICE Datele non-parametrice sunt mai frecvent utilizate în sociologie decât în psihologie. De exemplu.sav) care cuprinde următoarele variabile: VRST (vârsta subiecţilor). cu două valori: 1 semnifică subiecţi de gen masculin şi 2 subiecţi de gen feminin) şi VOT (cuprinde răspunsurile subiecţilor la întrebarea „Cu cine aţi votat la ultimele alegeri prezidenţiale?. Deoarece avem de a face cu scale nominale sau ordinale. 2-puţin. Aceste date se analizează pornind de la frecvenţele de apariţie ale diferitelor categorii sau de la probabilităţile de apariţie ale acestor categorii. în locul măsurării preferinţei pentru un anume tip de muzică folosind o scală ordinală de tipul „1-deloc. acolo unde acestea există în realitate. 3-mediu. precum media sau abaterea standard.foarte mult". 2 . datele pe care le obţinem folosind aceste scale de măsură nu mai pot fi analizate folosind metodele prezentate anterior. În consecinţă.

38. 3. 1. 2. 2. 37. 3. 2. Dacă însă doream să comparăm distribuţia cu o alta. 2. 21. 2. 36. 1. 1. Rezultatele testului apar în foaia cu rezultate sub forma a două tabele: În primul tabel sunt trecute elementele descriptive ale testului. 1 În exemplul nostru. 1. 41. 1. 2. folosind testul chi pătrat. 2. 2. cea teoretică la care se face raportarea şi abaterile frecvenţei observate de la frecvenţa teoretică (coloana RESIDUALS). 1. 3.NONPARAMETRIC TESTS opţiunea CHI-SQUARE: Vom introduce variabila VOT în câmpul pentru analiză (TEST VARIABLES LIST). 62. 2. frecvenţa observată. 35. 23. 22. 1. dorim să vedem cu cine au votat alegătorii din lotul nostru la ultimele alegeri prezidenţiale. 1. 1. ceea ce semnifică faptul că se va compara situaţia reală a votului cu situaţia în care candidaţii ar obţine acelaşi număr de voturi. 27. 2. 325 . 2. 34. Vom activa fereastra specifică testului din meniul ANALYZE . 51. 2. 2. 1. Deci. 1. în care categoriile nu s-ar mai fi distribuit egal. 2. 2 VOT: 2. 47. 32. 2. 2. categoriile sale. 2. 1. atunci foloseam opţiunea VALUES şi butonul ADD. 2 GR_MULT: 1. 19. 2. 2. 54. 1. 1. Se observă faptul că în câmpul EXPECTED VALUES este bifată opţiunea ALL CATEGORIES EQUAL. 2. 43. 29 GEN: 1. 2. 3. 2.ANALIZA COMPUTERIZATĂ A DATELOR VRST: 45. 1. 3. 2. 2. 2. 2. vom compara frecvenţa cu care oamenii au votat cei doi candidaţi.

ci calitativă şi ordinală. Toate testele neparametrice ce compară două eşantioane independente au la bază comparaţii ale rangurilor diferitelor intervale observate. TWO INDEPENDENT SAMPLES Aceste teste sunt echivalentul testului t pentru eşantioane independente. iar variabila independentă (GEN) în câmpul GROUPING VARIABLE.2. IV.NON-PARAMETRIC TESTS opţiunea TWO INDEPENDENT SAMPLES: Fereastra care apare pe ecran semănă foarte mult cu cea care apare la activarea testului t pentru eşantioane independente.55 ). prezentată în tabelul al doilea ( χ 2 = 5. Grupurile variabilei independente se definesc folosind butonul DEFINE GROUPS.018) la un grad de libertate. Vom analiza dacă apr diferenţe între subiecţii de gen masculin şi cei de gen feminin în ceea ce priveşte gradul de mulţumire faţă de situaţia actuală a ţării. Semnificativ mai mulţi oameni au votat pe Băsescu ca preşedinte comparativ cu cei care lau votat pe Geoană.LOREDANA GHERASIM Valoarea statistică a testului. Dintre cele patru tipuri de teste. care se bazează pe ierarhia rangurilor observaţiilor din cele două grupuri. Deci oamenii au votat în mod semnificativ diferit cei doi candidaţi la preşedinţie. este semnificativă (p=0. la fel ca şi în cazul testului t. Vom trece variabila dependentă (GR_MULT) în câmpul TEST VARIABLE LIST. Testul se activează din meniul ANALYZE .sav). Folosirea SPSS Pentru a ilustra aplicarea testului vom utiliza baza de date creată anterior (baza9. vom folosi MANN-WHITNEY U. În foaia cu rezultate apar următoarele tabele: 326 . doar că în acest caz variabila dependentă măsurată nu este cantitativă.

Pentru exemplul nostru vom selecta variabile ALIANTA şi PSD şi le vom trece în câmpul din stânga: 327 . 1. 1. IV.050. 1. 1. 1. 2. rangul mediu pentru subiecţii de gen masculin are valoare 9. 1. 1. pentru cei de gen feminin are valoarea 9. 3. 2. 1. 1. deci putem trage concluzia că femeile şi bărbaţii din studiul nostru nu diferă semnificativ în ceea ce priveşte gradul de mulţumire cu privire la situaţia actuală a ţării. în primul tabel este prezentată situaţia „descriptivă" (media rangurilor).slabă). 2. 1. 2. 3. 2. 1. 3. 1. 2. Prezentăm rezultatele subiecţilor: Alinata: 1.05).sav) care cuprinde două variabile: ALINATA (cuprinde răspunsurile subiecţilor la itemul „Evaluaţi contribuţia alianţei în integrarea europeană”. pentru a se activa opţiunile ferestrei. 1. 2. 1. variabila are trei valori 1 . 2. 3.3.17. 2. 3. Dacă diferenţele ar fi fost semnificative (p<0. Valoarea pragului de semnificaţie (p=0. sensul diferenţei ar fi fost dat de semnul notei Z. 3. 2 Dorim să vedem dacă subiecţii au o părere mai bună despre unul dintre cele două partide politice. Se foloseşte din meniul NON PARAMETRIC TESTS opţiunea TWO RELATED SAMPLES. 2. 3. 2. Pentru a ilustra aplicarea acestui test vom folosi o nouă bază de date (baza10. 2 .importanta.medie şi 3 . 2. 1. Deoarece subiecţii răspund la ambele întrebări trebuie aplicată o metodă care să permită compararea eşantioanelor perechi. 1. 1.importanta. variabila are trei valori 1 . Ca şi la acest test. 2. 1.778) este mai mare de 0. 2. 2 PSD: 2.ANALIZA COMPUTERIZATĂ A DATELOR Observaţi că stilul de prezentare al rezultatelor este similar cu cel de la testul chi-pătrat. 1. Astfel. 2. 3. 1. 2. 2. iar valoarea pragului de semnificaţie a testului este dată în tabelul al doilea (linia denumită ASYMP.medie şi 3 . TWO RELATED SAMPLES Metodele care compară două eşantioane perechi sunt similare aplicării testului t pentru eşantioane perechi. trebuie selectată o pereche de variabile pentru analiză. 3. 2. 1. Fereastra seamănă cu cea a testului t pentru eşantioane perechi. SIG). scrisă imediat deasupra valorii pragului de semnificaţie.83. 2 .slabă) şi PSD (cuprinde răspunsurile subiecţilor la itemul „Evaluaţi contribuţia alianţei în integrarea europeană”.

LOREDANA GHERASIM Vom utiliza testul WILCOXON. 328 . ca mai jos: În primul tabel apare media şi suma rangurilor diferenţelor pozitive şi negative.281). comparând separat diferenţele pozitive şi negative. Din al doilea tabel observăm că testul este nesemnificativ (p=0. se face în două tabele. care se bazează pe rangul valorilor absolute al diferenţelor dintre două variabile. unul pentru valorile descriptive şi altul pentru semnificaţia testului. Aceste rezultat indică faptul că oamenii consideră ca ambele partide contribuie la fel de mult la integrarea României în Uniunea Europeană. Indicii de sub acest tabel arată sensul diferenţelor. precum şi cazurile în care scorurile sunt la egalitate. Prezentarea rezultatelor testului. în foaia cu rezultate.

Sign up to vote on this title
UsefulNot useful