SCOPUL UNITĂŢII DE CURS ▪ oferă noţiuni, explicaţii şi aplicaţii pentru a înţelege şi opera eficient cu programul SPSS 10.

0 în scopul prelucrării statistice a datelor. OBIECTIVE OPERAŢIONALE În urma studierii acestei unităţi de curs, studenţii: ▪ vor putea să definească variabilele şi să conceapă o bază de date adecvată; ▪ vor redefini şi transforma variabile; ▪ vor prelucra datele statistice la nivel descriptiv; ▪ vor realiza analiza corelaţională a datelor şi vor interpreta rezultatele obţinute; ▪ vor folosi testul t pentru compararea unui eşantion cu o populaţie şi a două eşantioane (perechi sau independente) şi vor interpreta rezultatele obţinute; ▪ vor utiliza analiza de varianţă pentru analiza efectului unui singur factor şi vor interpreta rezultatele obţinute; ▪ vor utiliza analiza de varianţă pentru analiza efectelor de interacţiune; ▪ vor utiliza metode non-parametrice de analiză a datelor. EVALUARE ▪ 40% din nota finală examen practic care presupune prelucrarea şi interpretarea datelor; ▪ 60% din nota finală evaluările de pe parcursul seminariilor, care vor presupune prelucrări şi analize statistice ale datelor.

OBSERVAŢIE !!! Cursul nu epuizează opţiunile programului SPSS şi nu suplineşte lipsa informaţiilor statistice teoretice.

ANALIZA COMPUTERIZATĂ A DATELOR

I. FAMILIARIZAREA CU PROGRAMUL SPSS 10.0
I.1. TIPURI DE VARIABILE. DIFERENŢA DINTRE VARIABILE, VALORI ŞI SCORURI Variabile sunt definite ca proprietăţi ale fenomenelor, obiectelor sau proceselor, care pot lua diferite valori. Există mai multe criterii în funcţie de care se pot clasifica variabilele: după natura măsurii variabilele pot fi: cantitative (variază cantitativ, cum ar fi de exemplu greutatea sau vârsta subiecţilor) sau calitative (sunt cele care variază calitativ, cum ar fi genul sau etnia subiecţilor); după felul variaţiei, variabilele pot fi: continui (teoretic pot lua orice valoarea, între două valori ale variabilei putând să apară o a treia valoare; vârsta subiecţilor este un exemplu de variabilă continuă) sau discrete (pot avea numai anumite valori, între care nu mai apar altele; religia, tipurile temperamentale sunt exemple de variabile discontinui); după scopul folosirii lor în studii experimentale: independente (sunt variabilele manipulate de experimentator şi care se presupune că influenţează variabila dependentă) sau dependente (reprezintă răspunsurile subiecţilor). O variabilă poate lua diferite valori. Valoarea reprezintă o măsură calitativă sau cantitativă a unui fenomen. Spre exemplu, pentru variabila “nota şcolară” valorile acesteia sunt toate notele de la 1 la 10. Pentru variabila “zilele săptămânii” valorile sunt toate cele şapte zile ale săptămânii. În psihologie se face distincţia între valori şi scoruri. Scorul este valoarea obţinută de o persoană, fenomen sau obiect atunci când ne referim la o anume variabilă. Spre exemplu, nota pe care o obţine un elev la o materie (să zicem 7) reprezintă scorul subiectului la variabila “nota şcolară”. I.2. PREZENTAREA APLICAŢIEI SPSS SPSS (în traducere Pachet statistic pentru ştiinţele sociale) este numele unui pachet de programe care ajută la analiza datelor obţinute în cercetările din domeniul ştiinţelor sociale. Deschiderea programului se poate face cu ajutorul mouse-ului, cu dublu-click asupra pictogramei programului de pe desktop. Aplicaţia mai poate fi deschisă de la butonul START/PROGRAME, opţiunea SPSS FOR WINDOWS, ca în imaginea de mai jos:

Oricare ar fi metoda de deschidere a programului, pe ecran va apărea următoarea fereastră:

251

LOREDANA GHERASIM

Prima bară din partea de sus a ferestrei oferă informaţii despre denumirea aplicaţiei şi numele fişierului cu care se lucrează. Urmează bara de meniuri a programului şi cea cu butoane. Foia cu date este organizată tabelar. Întotdeauna coloanele tabelului reprezintă variabilele studiului, în timp ce liniile, rândurile numerotate ale tabelului reprezintă subiecţii cercetării. În partea de jos a ferestrei sunt două opţiuni: DATA VIEW şi VARIABLE VIEW. Putem vizualiza datele brute ale subiecţilor, dacă este activă opţiunea DATA VIEW sau putem vizualiza descrierea variabilelor introduse în baza de date, dacă este activată opţiunea VARIABLE VIEW. De obicei, atunci când deschidem programul, este activă opţiunea DATA VIEW, cum se poate observa şi în imaginea de mai sus. Printr-un simplu click stânga pe opţiunea VARIABLE VIEW, pe ecran apare un alt tabel care permite definirea variabilelor din baza de date: Din meniul FILE putem alege comanda deschidere a unei noi baze de date (opţiunea NEW DATA) sau a unei noi foi de rezultate (NEW OUTPUT): Acest program prezintă rezultatele prelucrărilor statistice într-o pagină separată, numită OUTPUT. Comenzile care sunt colorate în gri sunt comenzi inactive pentru că baza de date nu conţine, deocamdată, nici o informaţie. Din acest meniu putem deschide, folosind opţiunea OPEN, o bază de date care a fost creată anterior (DATA) sau un fişier cu rezultatele prelucrărilor statistice anteriore (OUTPUT).

252

După activarea comenzii pe ecran apare o casetă de dialog care permite selectarea directorului şi respectiv fişierului care conţine baza de date. comanda SAVE AS permite salvarea unui fişier modificându-i numele. viitor. DESCHIDEREA UNEI BAZE DE DATE Pentru deschiderea unei baze de date create anterior se activează meniul FILE/OPEN opţiunea DATA. subiectul de pe rândul 9 are valoare 3 la variabila gr_mult. În momentul încărcării bazei de date pe ecran va apărea următoarea imagine: Valorile din baza de date reprezintă răspunsurile brute ale subiecţilor. parlam). guv. Opţiunile RECENTLY USED DATA şi RECENTLY USED FILES deschid bazele de date şi foile cu rezultate recent create sau utilizate în programul SPSS. directie. Din meniul EDIT. prezent. activarea comenzii COPY/CUT din meniul EDIT. De exemplu. valoarea 3 la variabila prezent. CUT şi PASTE sunt folosite pentru copierea sau mutarea datelor din celule. Rândurile conţin răspunsurile subiecţilor la diferiţi itemi.ANALIZA COMPUTERIZATĂ A DATELOR Comanda SAVE permite salvarea obişnuită a fişierului cu date sau cu rezultate. fişierele cu baze de date au întotdeauna extensia sav) care se găseşte la adresa C:\MY DOCUMENTS\EXEMPLE SPSS.sav (în aplicaţia SPSS. plasarea cursorului în noua locaţie şi apoi activarea comenzii PASTE. În această bază de date avem pe coloană variabile (ca de exemplu. valorile numerice din fiecare coloană reprezentând scorurile subiecţilor la aceste variabile. comenzile COPY.3. Pentru a vedea ce înseamnă fiecare dintre aceste variabile trebuie activată opţiunea VARIABLE VIEW: 253 . 4 la variabila viitor etc. rânduri sau coloane. Pe coloane sunt definite variabilele. Copierea sau mutarea datelor presupune selectarea datelor. gr_mult. Vom deschide fişierul opinii. I.

Spre exemplificare. fără spaţiu sau semne de punctuaţie. Pentru introducerea datelor se plasează cursorul în celulă şi se introduce valoarea cu ajutorul tastelor. Rezultatul va fi următorul: Numele variabilei poate să cuprindă maxim opt caractere.4. La fel se vor introduce şi celelalte valori ale primei variabile. De exemplu. 254 . iar indicativul primei linii devine activ. Pentru a utiliza cu uşurinţă datele este indicată definirea sau redenumirea variabilelor cu care lucrăm. După introducerea primei valori automat programul a denumit prima variabilă (var0001). Definirea variabilelor presupune activarea câmpului VARIABLE VIEW. Baza de date va conţine patru variabile: numărul subiecţilor (nrsub). Vom crea o baza de date care să conţină rezultatele la anxietate obţinute de un număr de subiecţi. variabila gr_mult este o variabilă de tip numeric. nivelul anxietăţii subiecţilor înaintea terapiei (ANX1) şi nivelul anxietăţii subiecţilor după terapie (ANX2) şi genul subiecţilor (1-subiecţi de gen masculin şi 2-subiecţi de gen feminin). cu 20 de caractere la partea întreaga şi 0 zecimale. Pentru a defini o variabilă. prin executarea unui dublu click pe numele variabilei (în cazul nostru var0001) sau prin activarea butonului VARIABLE VIEW din partea de jos a câmpului. vom introduce prima valoare (1) a primei variabile. trebuie plasat cursorul în celula în care este trecut numele (NAME) generic al variabilei (var0001). apoi se introduce numele variabilei NRSUB folosind tastatura. reprezentând itemul „Cât de mulţumit sunteţi în general de felul în care trăiţi?”. coloanele reprezentând diferite caracteristici ale variabilelor. Opţiunea TYPE permite specificarea tipului de date. La studiu au participat subiecţi de gen feminin şi masculin. I. Această opţiune poate fi activată cu ajutorul mouse-ului cu un click stânga pe butonul gri din celula corespunzătoare variabilei.LOREDANA GHERASIM Variabilele sunt aşezate pe rânduri. CREAREA UNEI NOI BAZE DE DATE Pentru a crea o nouă bază de date trebuie activată opţiunea DATA VIEW. înainte şi după intervenţia terapeutică (anxietatea a fost măsurată cu ajutorul unei scale de anxietate).

Din acest motiv trebuie precizată semnificaţia valorilor variabilei. lunile şi anii. Definirea detaliată a variabilei apare în pagina de rezultate. reţinând întreaga valoare. VALUE LABEL permite descrierea valorile pe care le poate lua o variabilă. ANX1. NUMERIC şi STRING (foarte rar). iar CUSTOM CURRENCY permite introducerea de valorilor pozitive dar şi a celor negative. ANX2 şi Gen. Acest lucru presupune atribuirea de valori şi etichete celor două grupuri de subiecţi. dreapta sau central. ALIGNMENT permite modificarea modului în care sunt prezentate datele pe ecran. cu sau fără separator pentru mii. a barelor de separarea pentru a delimita zilele. vom defini numele variabilei NRSUB şi vom detalia eticheta la opţiunea LABEL ca în imaginea de mai jos: Vom introduce valorile şi vom defini şi următoarele variabile. Astfel. COLUMN permite specificarea numărului de caractere pentru o coloană. apare selectat tipul NUMERIC. Variabila Gen este de tip categorial. punctelor. DATE permite folosirea spaţiilor. în funcţie de această caracteristică subiecţii fiind împărţiţi în două categorii distincte. Opţiunea este folosită pentru variabile care folosesc coduri numerice pentru a reprezenta categorii (de exemplu. iar pe cei de gen feminin cu valoarea 2. afectând vizualizarea datelor. Tipul DOLLAR inserează în faţa valorilor simbolul dolarului. femei şi bărbaţi. în psihologie se utilizează două tipuri de variabile. subiecţii de sex masculin îi vom codifica cu valoarea 1. Deşi sunt mai multe tipuri de variabile. respectiv orele şi minutele. Automat la crearea unei noi baze de date. Opţiunea TYPE este de obicei folosită pentru modifica acest tip de date. aliniate la stânga. presupunându-se că noile variabile vor fi numerice. Este posibilă alegerea numărului de cifre pentru partea întreagă (WIDTH) şi a numărului de zecimale (DECIMAL PLACES). În exemplu nostru. În acest scop vom activa opţiunea VALUE: 255 . Caracteristica LABELS permite definirea detaliată a variabilei (pot fi folosite până la maxim 256 caractere.ANALIZA COMPUTERIZATĂ A DATELOR Tipul NUMERIC permite introducerea valorilor cu sau fără zecimale. MISSING VALUES permite stabilirea valorilor care nu vor fi luate în seamă la prelucrarea datelor. Ultima opţiune STRING permite introducerea variabilelor alfanumerice. Tipul SCIENTIFIC NOTATION transformă logaritmic valorile introduse. virgulelor. inclusiv spaţiul). se pot folosi valorile 1 şi 2 pentru a codifica genul feminin şi masculin). Tipurile COMMA şi DOT permit introducerea valorilor cu orice număr de zecimale (mai mare de 16).

Această opţiune se foloseşte numai pentru variabilele categoriale. Vom salva fişierul cu numele Baza1. Salvarea fişierelor se face fie acţionând butonul SAVE care se găseşte în bara de instrumente. fie din meniul FILE se alege opţiunea SAVE.LOREDANA GHERASIM Se trece valoarea în câmpul VALUE şi numele grupului sau categoriei în câmpul VALUE LABEL. Astfel.sav în subdirectorul EXEMPLE SPSS care se găseşte în directorul MY DOCUMENTS. vom scrie „1” în câmpul VALUE şi „subiecţi de gen masculin” în câmpul VALUE LABEL şi activăm butonul ADD. după care se apasă butonul ADD. apoi vom scrie „2” în câmpul VALUE şi „subiecţi de gen feminin” în câmpul VALUE LABEL şi activăm butonul ADD. Se activează butonul OK pentru a salva modificările şi închide caseta de dialog. care împart subiecţii în grupuri distincte. Reamintim că trebuie ales mai întâi directorul în care vream să salvăm fişierul si apoi scriem numele fişierului. 256 .

ANALIZA COMPUTERIZATĂ A DATELOR II. cu alte cuvinte. Acestea presupun transformarea intervalelor de frecvenţă în bare. Atunci când curba este înclinată spre dreapta. Poligoanele de frecvenţă sunt o altă modalitate de reprezentare grafică a datelor din tabelele de frecvenţă. bimodale (au două vârfuri) sau multimodale (au mai multe vârfuri). prin unirea mijloacelor părţilor superioare ale barelor histogramelor. fiind cele mai simple procedee ale statisticii descriptive. distribuţia este înclinată pozitiv. Modalitatea indică câte “vârfuri” are o distribuţie. arată valorile în jurul cărora se grupează rezultatele subiecţilor.1. mai comprehensibilă. Înclinarea arată dacă în distribuţie apar mai multe valori mari sau mai multe valori mici. Analiza de frecvenţă cu ajutorul programului SPSS Opţiunea FREQUENCIES permite realizarea tabelului de frecvenţă şi a distribuţiei de frecvenţă a rezultatelor. Cele mai multe aspecte măsurate în psihologie prezintă un număr aproximativ egal de cazuri de o parte şi de alta a mijlocului. înălţimea barelor corespunzând frecvenţei fiecărui interval de frecvenţă din tabelul de frecvenţă. astfel. prezentând modul în care se distribuie sau se împrăştie cazurile sau frecvenţele. histograma şi poligonul de frecvenţă descriu o distribuţie de frecvenţă. distribuţia este înclinată negativ. notele şcolare au o distribuţie înclinată spre dreapta. Din această perspectivă. Aceasta se găseşte la meniul ANALYZE – DESCRIPTIVE STATIASTICS: 257 . informaţia devenind. Acestea se obţin. care permit înţelegerea tendinţei unui grup de scoruri. distribuţiile fiind aproximativ simetrice (nu prezintă tendinţă de înclinare). Tabelele de frecvenţa grupează scorurile subiecţilor. înclinarea şi turtirea sunt indicatori care descriu forma distribuţie scorurilor. Spre exemplu. ELEMENTE DE STATISTICĂ DESCRIPTIVĂ II. iar când curba este înclinată spre stânga. O distribuţie este înclinată atunci când are o extremă (o parte) mai împrăştiată şi mai lungă. reprezentări grafice ale tabelelor de frecvenţă permit o mai bună înţelegere a tendinţei grupului de rezultate. Faţă de curba normală o distribuţie poate fi mai turtită (scorurile din cadrul ei variază foarte mult de la medie) sau mai ascuţită (scorurile variază foarte puţin de la medie). Tabelul de frecvenţă. Modalitatea. Histogramele. Turtirea unei distribuţii se raportează la curba normală. ANALIZA FRECVENŢELOR Tabelele de frecvenţă ajută la descrierea unui grup de scoruri. adică elevii au tendinţa de a obţine mai multe note mari. distribuţiile pot fi unimodale (au un singur vârf).

Acest mod de organizare în două câmpuri apare la aproape toate opţiunile de prelucrare a datelor. în ordinea introducerii lor în baza de date. Opţiunea FORMAT permite modificarea formei de prezentare a datelor în foia cu rezultate (OUTPUT). dorim realizarea tabelului de frecvenţă şi histogramei pentru variabila „nivelul anxietăţii înainte de terapie” (ANX1). se bifează afişarea curbei normale (WITH NORMAL CURVE). împreună cu denumirea extinsă a variabilei. Opţiunea STATISTICS deschide o fereastră cu opţiuni de prelucrare statistică. Se selectează din câmpul din stânga variabila pe care vrem să analizăm apoi se activează butonul de trecere. Câmpul din dreapta reprezintă câmpul de analiză. CHART VALUES permite alegerea tipului de valori afişate în grafic (Frecvenţe sau Procentaje). butonul CHARTS permite afişarea histogramei de frecvenţă. Pentru exemplul nostru se selectează opţiunea HISTOGRAMS. apoi se activează butonul CONTINUE. analiza statistică se realizează doar pentru variabilele trecute în acest câmp. Pentru exemplul nostru. Trecerea variabilelor în câmpul de analiză se realizează cu ajutorul butonului cu săgeată care se găseşte între câmpuri. Pentru afişarea histogramei de frecvenţă se activează butonul CHARTS: Opţiunea CHART TYPE permite alegerea unui tip de grafic (cu bare.LOREDANA GHERASIM După activarea opţiunii pe ecran apare următoarea casetă de dialog: În câmpul din stânga al casetei FREQUENCIES sunt afişate toate variabilele din baza de date. Opţiunea FORMAT permite modificarea formei OUTPUT-ului. plăcintă sau histogramă). Bifarea opţiunii DISPLAY FREQUECY TABLES are ca efect afişarea în foaia de rezultate a tabelul de frecvenţă. Astfel. Se selectează variabila ANX1 din câmpul din stânga şi se activează butonul de trecere: Pentru ca în foaia de rezultate să apară tabelul de frecvenţă se selectează opţiunea DISPLAY FREQUECY TABLES. Activarea acestui buton are ca efect apariţia următoarei casete de dialog: 258 .

indiferent dacă aceştia au sau nu scoruri la această variabilă. Dacă unii subiecţi nu ar fi răspuns la chestionarul de anxietate. de la cel mai mic scor la până la cel mai mare. atunci cele două coloane ar fi conţinut valori diferite. Al doilea tabel este organizat în cinci coloane. Rezultatele sunt organizate în două tabele. VALID PERCENT prezintă procentajul luând în calcul doar subiecţii care au răspuns la această variabilă. adică numărul de subiecţi care obţin o anumită valoare. Pentru exemplu nostru. Pentru exemplul nostru. iar cel din dreapta arată conţinutul foii cu rezultate. putem vizualiza reprezentarea grafică a frecvenţei scorurilor: 259 . De exemplu. Coloana PERCENT transformă frecvenţa obţinută pentru fiecare valoare în procentaj ţinând cont de numărul total de subiecţi luaţi în calcul. Pe ecran apare o fereastra cu rezultate. Derulând pagina cu rezultate sau selectând HISTOGRAM în câmpul din stânga. În primul tabel se precizează numărul de subiecţi şi numărul de răspunsuri. Coloana FREQUENCY prezintă frecvenţa. Spre exemplu. cel din stânga. numită OUTPUT: Fereastra OUPUT este organizată în două câmpuri. Coloana VALID prezintă valorile variabilei. pentru fiecare variabilă. După selectarea opţiunilor de realizare a tabelului de frecvenţă şi histogramei. ceea ce reprezintă 10% din totalul numărului de răspunsuri obţinute. vom păstra opţiunile selectate automat. avem 20 de subiecţi care au răspuns la chestionar (nu lipseşte nici o valoare). În cazul nostru coloanele PERCENT şi VALID PERCENT sunt identice deoarece toţi subiecţii au scoruri la această variabilă. prezentate în ordine crescătoare (fără a ţine seama de cazurile lipsă). doi subiecţi au obţinut scorul 103.ANALIZA COMPUTERIZATĂ A DATELOR Câmpul din stânga al ferestrei conţine opţiuni de aranjare a rezultatelor (în ordine descrescătoare sau crescătoare a valorilor sau cantităţilor). iar cel din dreapta conţine opţiuni de prezentare comparativă a rezultatelor şi de organizare separată a foii de rezultate. 60% dintre subiecţi au note mai mici sau egale cu 106. afişează structura sau cuprinsul OUPUT-ului. Coloana CUMULATIVE PERCENT prezintă procentajul cumulat. se activează butonul OK al casetei FREQUENCIES.

reprezentativă a unui grup de scoruri. Activarea opţiunii duce la apariţia următoarei casete de dialog: 2 1 3 Elementele principale ale ferestrei sunt: 1. arată valoarea tipică. câmpul în care se introduce variabila pentru care dorim să realizăm histograma de frecvenţă 3.2. folosind ca indicatori varianţa şi abaterea standard.LOREDANA GHERASIM Histograma de frecvenţă se mai poate obţine folosind meniul GRAPHS – HISTOGRAM. Se obţine aceeaşi reprezentare grafică ca şi în cazul folosirii butonului CHART al ferestrei FREQUENCIES. deoarece abaterile de la medie într-o direcţie (abaterile scorurilor mici de la medie) sunt egale cu 260 . în câmpul VARIABLE şi bifăm opţiunea DISPLAY NORMAL CURVE. mediana şi modul şi tendinţa de împrăştiere a grupului de scoruri. folosind ca indicatori media. cu ajutorul butonului cu săgeată. Pentru exemplificare introducem variabila ANX1. Media este punctul faţă de care scorurile sunt egal depărtate. Media aritmetică descrie tendinţa centrală într-un grup de rezultate. câmpul în care sunt prezentate toate variabilele din baza de date 2. Vizualizarea ferestrei OUTPUT sau DATE (baza1.sav) se poate face folosind meniul WINDOW. marcând opţiunea dorită (baza de date sau foaia de rezultate): II. selectarea acestei opţiuni va duce la afişarea curbei normală de distribuţie a rezultatelor. IDENTIFICAREA TENDINŢEI CENTRALE ŞI A VARIABILITĂŢII SCORURILOR Metodele descriptive pentru identificarea tendinţei centrale şi de împrăştiere indică tendinţa centrală a unui grup de scoruri.

Este indicatorul care este cel mai puţin afectat de schimbările structurii (modificări ale numărului de scoruri sau mărimii scorurilor distribuţiei). Varianţa (SD2=( ∑ (X-M)2/N) unei distribuţii arată cât de “împrăştiate” sunt scorurile în jurul valorii centrale. Trebuie să cunoaştem gradul de variabilitate a scorurilor noastre. Cunoaşterea acestor indicatori nu este suficientă pentru a descrie complet o distribuţie. Mediana împarte distribuţia în două părţi egale. media aritmetică rămâne metoda cel mai des utilizată pentru descrierea tendinţei grupului de scoruri. cu atât mai mult se împrăştie scorurile în jurul valorii centrale. În intervalul cuprins între medie şi o abatere standard la stânga şi dreapta mediei găsim aproximativ 2/3 din totalul scorurilor. Abaterea standard ne arată cu cât se împrăştie scorurile în jurul valorii centrale şi se măsoară în aceleaşi unităţi de măsură ca şi scorurile iniţial. Modul reprezintă valoarea cu frecvenţa cea mai mare. Este o măsură a gradului de variabilitate a scorurilor şi arată cât de mult se abat scorurile de la tendinţa centrală. Vom calcula parametrii tendinţei centrale şi ai variabilităţii pentru variabila ANX1 (nivelul anxietăţii înaintea terapiei). Abaterea standard este rădăcina pătrată a varianţei (SD = SD 2 ). După cum se poate vede şi în imaginea de mai jos. însă. „Baza1. Există însă metode statistice (cum a fi testele neparametrice) în care se utilizează doar mediana şi modul.sav”. acest indicator intrând în componenţa multor metodele statistice. normale m+SD scoruri mari Scorurile care sunt mai mari decât media cu o abatere standard sunt considerare scoruri mari iar cele mai mici decât media cu mai mult de o abatere standard sunt considerate ca fiind scoruri slabe. jumătate dintre scorurile distribuţie având valori mai mici ca mediana. casetă de dialog care se deschide cuprinde patru câmpuri cu opţiuni: 261 . Mediana este şi ea destul de puţin afectată de modificările structurii distribuţiei. Ilustrăm grafic acest lucru: m-SD scoruri mici m scoruri medii. indică gradul de variabilitate a unui grup de rezultate. fiind indicatorul cel mai descriptiv (deoarece indică orice modificare survenită în distribuţie). Se trece variabila în câmpul din dreapta apoi se activează butonul STATISTICS. este cea mai “sensibilă” la modificarea numărului de scoruri sau mărimii scorurilor. Se recomandă utilizarea mediei în distribuţiile simetrice şi unimodale. Aceste rezultate sunt considerate tipice sau normale pentru o distribuţie. Cu cât este mai mare această valoare. Media.ANALIZA COMPUTERIZATĂ A DATELOR abaterile în cealaltă direcţie (abaterile scorurilor mari de la medie). trebuie să ştim cât de mult (sau cu cât) se împrăştie scorurile în jurul valorii medii. Cu toate acestea. Pentru a cunoaşte exact cu cât variază scorurile în medie este nevoie să calculăm deviaţia standard. Pentru analiză vom folosi baza de date realizată anterior. iar cealaltă jumătate valori mai mari. Mediana şi modulul. Mai precis. tipice. care sunt mai stabile sunt recomandate pentru descrierea distribuţiilor asimetrice şi multimodale. Calculul tendinţei centrale şi a variabilităţii folosind SPSS Meniul din SPSS care permite calculul indicatorilor tendinţei centrale şi ai împrăştierii se găseşte la ANALYZE – DESCRIPTIVE STATISTICS – FREQUENCIES.

mediana (MEDIAN).LOREDANA GHERASIM Câmpul PERCENTILE VALUES conţine opţiuni care permit calculul valorilor corespunzătoare împărţirii subiecţilor în grupuri egale. MEDIAN. mod (MODE) şi suma valorilor seriei (SUM). Această opţiune permite calculul cuartilelor (QUARTILES) sau altor cuartile (de exemplu CUT POINTS FOR 10 EQUAL GROUPS) sau centile (PERCENTILE).E. MODE din câmpul CENTRAL TENDENCY şi opţiunile STD DEVIATION şi VARIANCE din câmpul DISPERSION: Activăm butonul CONTINUE şi apoi cel OK al casetei FREQUENCIES. Opţiunile din câmpul DISPERSION permit calcularea diferiţilor parametri referitori la dispersia (împrăştierea) scorurilor în jurul valorii centrale: abatere standard (STD. valori minime (MINIMUM) şi maxime (MAXIMUM) şi eroare standard (S. Pentru exemplu nostru ne interesează calculul parametrilor tendinţei centrale ai distribuţiei şi de împrăştiere. Câmpul DISTRIBUTION oferă posibilitatea aflării indicatorilor de turtire (KURTOSIS)şi înclinare ai unei distribuţii în comparaţie cu cea normală (SKEWNESS). În consecinţă se bifează (cu un simplu click stânga al mouse-ului) opţiunile MEAN. MEAN care reprezintă abaterea standard a distribuţii tuturor mediilor posibile calculate pentru eşantioane aleatoare repetate). Valorile indicatorilor sunt grupate în tabelul Statistics: 262 . prin afişarea valorilor care delimitează aceste grupuri. amplitudine (RANGE). DEVIATION). varianţă (VARIANCE). CENTRAL TENDENCY conţine opţiunile folosite pentru calculul indicatorilor tendinţei centrale ale distribuţiei: media (MEAN).

5.90. Med=105. 263 . M=107. Mod=104. ceea ce însemnă că distribuţia este unimodală (apare o singură valoare la mod) şi uşor înclinată spre dreapta spre valorile mai mari ale variabilei (valoarea mediei este mai mare decât a medianei). La fel se calculează indicatorii tendinţei centrale şi de împrăştiere pentru variabila ANX2 (nivelul anxietăţii subiecţilor după terapie). Distribuţia scorurilor subiecţilor la această variabilă indică aceeaşi formă. Mod=110 (a doua valoare a modul se extrage din tabelul de frecvenţă). Rezultatele obţinute sunt următoarele: Astfel.ANALIZA COMPUTERIZATĂ A DATELOR Astfel. Med=109. Distribuţia scorurilor este bimodală (apar două valori cu frecvenţa cea mai mare) şi înclinată spre valorile mici ale variabilei (media este mai mică decât mediana).95. M=107.5. Mod=102. Reprezentarea grafică indică apariţia unui singur vârf (distribuţie unimodală) şi o alungire şi împrăştiere a extremei drepte a distribuţiei (distribuţie înclinată spre dreapta).

limitei minime de variaţie tipică îi corespunde scorul standard -1. De asemenea. +1]. Scorurile Z îndeplinesc o serie de funcţii. valorile fiind mai grupate în jurul medie (şi varianţa şi abaterea standard au valori mai mici). dacă scorurile la un test de inteligenţă într-o populaţia sunt descrise de media m=100 şi deviaţia standard SD=15. tipice normale m+SD scoruri”mari” x -1 0 +1 Z Aceasta distribuţie ne permite să stabilim cum este scorul x în raport cu media (care este 0) şi abaterea standard (care are valoarea 1).LOREDANA GHERASIM Comparând reprezentările histogramele de frecvenţă pentru variabilele ANX1 şi ANX2. distribuţia fiind mai turtită (în acest caz varianţa şi abaterea standard au valori mai mari). iar limitei maxime de variaţie normală îi corespunde nota standard +1. Permit compararea unui scor cu o distribuţie la care cunoaştem parametrii (media şi deviaţia standard). dacă scorul său Z are valoare mai mică decât –1. notele Z arată de câte ori acel scor este mai mare sau mai mic decât media (ţinând cont de variabilitate). putem analiza variabilitatea rezultatelor la cele două variabile. Spre exemplu. întrucât notele Z arată raporturi şi sunt adimensionale (nu depind de ceea ce măsurăm). II. mediu sau mare. Nota standard Z arată cu câte deviaţii standard se abate un scor de la medie (Z=(X-M)/SD). Mediei îi corespunde întotdeauna mereu scorul standard 0.3. iar abaterea standard valoarea 1. un scor x este considerat “mare” raportat la distribuţia Z. o persoană cu scorul brut 130 este „de două ori mai deşteptă ca media celorlalţi”. distribuţia scorurilor pentru prima variabilă este mai ascuţită. un scor x este considerat “mediu” dacă scorul său Z este cuprins în intervalul [–1. O altă funcţie a notelor z este aceea că permit compararea scorurilor obţinute de aceeaşi persoană la probe diferite. Astfel. dacă scorul său Z va fi mai mare decât +1. astfel. Trebuie ţinut seama de o serie de reguli. ne ajută să precizăm dacă un scor este mic. La variabila ANX2 se constată o mai mare variabilitate a rezultatelor. m-SD scoruri”mici” m scoruri medii. 264 . Distribuţia în note Z este o distribuţie ideală în care media are întotdeauna valoarea 0. SCORURILE Z Nota Z indică deviaţia unui scor (x) de la medie (m) exprimată în deviaţii standard. Astfel. un scor x raportat la distribuţia Z este considerat “mic”. deoarece acestui scor îi corespunde un scor Z de +2 (ceea ce înseamnă că scorul este mai mare ca media cu două deviaţii standard). Schema de mai jos prezintă notele standard Z corespunzătoare mediei şi limitelor de variaţie maximă şi minimă.

Activarea comenzii duce la apariţia pe ecran a casetei de dialog următoare: 1 2 3 4 Prezentăm principalele elemente ale ferestrei DESCRIPTIVES: 1. câmpul în care se introduc variabilele care vor fi analizate 3. care deschide următoarea fereastră: Automat sunt selectate de computer opţiunile de calcul al mediei. Se activează butonul OPTIONS. cuprinde opţiuni de calcul ai parametrilor distribuţiei. abaterii standard şi al valorii minime şi maxime. 4. opţiunea SAVE STANDARDIZED VALUES AS VARIABLES permite salvarea în baza de date a scorurilor standard sub forma unei noi variabile.sav”). Vom folosi baza de date creată anterior („Baza1. vom calcula notele Z pentru variabila ANX1. câmpul în care sunt prezentate variabilele din baza de date 2. permite calculul notelor Z cu ajutorul SPSS. Vom activa butonul CONTINUE şi apoi butonul OK al ferestrei pentru a putea face 265 . Se bifează opţiunea SAVE STANDARDIZED VALUES AS VARIABLES.ANALIZA COMPUTERIZATĂ A DATELOR Calculul notelor Z folosind SPSS Comanda DESCRIPTIVES care se găseşte în meniul ANALYZE – DESCRIPTIVE STATISTICS. Pentru exemplificare.

cu numele ZANX1. Se observă apariţia unei noi variabile.98 pentru o valoare brută de 102. Corelaţia indică existenţa unei legături între variabile. Prin transformarea notelor brute obţinute de subiecţi la cele două variabile putem să identificăm dacă exista sau nu o legătură între aceste două variabile. Se constată că cel mai mare scor z este 2. iar cea mai mică valoare la anxietate a obţinut-o subiectul 8. care are un scor z–0. pe ultima coloană. întrucât ea descrie ce se petrece într-un grup de rezultate (r=( ∑( Z1 * Z 2) / N ). Scorul primului subiect este atipic. II. rezultatul fiind aproape cu o unitate mai mic decât media.6 care corespunde unui scor standard 124 obţinută de subiectul 15. ceea ce semnifică faptul că subiectul are un nivel ridicat al anxietăţii raportat la ceilalţi subiecţi. Corelaţia este o metodă statistică descriptivă. nivelul anxietăţii acestuia fiind de 2 ori şi jumătate mai mare decât media. legătură care poate fi pozitivă (când scorurile slabe la prima variabilă se asociază cu scoruri slabe la a doua variabilă. COEFICIENTUL DE CORELAŢIE PEARSON Notele Z fac posibilă analiza legăturii dintre două variabile. Putem analiza rezultatele obţinute.LOREDANA GHERASIM analiza statistică. Rezultatele obţinute în urma comenzii DESCRIPTIVES sunt mai sumare şi prezentate într-un singur tabel.4.+1). scorurile medii la prima variabilă se asociază cu scoruri medii la a doua variabilă şi scorurile mari la 266 . putem analiza legătura dintre nivelul stresului unui manager şi numărul de subordonaţi. Subiectul al doilea are un nivel normal al anxietăţii. De exemplu. Vom vizualiza baza de date pentru a vedea dacă apare noua variabilă care conţine rezultatele subiecţilor transformate în note Z. dar plasându-se în limita (–1 .

fie a apărut a o treia variabilă care a determinat apariţia simultană a celor doua variabile.050. prezentate în tabelul de mai jos: Evenimentul Apare Nu apare Predicţia Apare Corect Eroarea I Evenimentului Nu apare Eroarea II Corect Sunt două situaţii în care se poate greşi: când afirmăm că un eveniment se va produce şi în realitate acesta nu va apărea (eroare de tip I) sau când afirmăm că un eveniment nu se va produce şi aceste va apare (Eroare de tip II). Mai precis. vom considera un test statistic ca fiind semnificativ dacă pragul de semnificaţie este mai mic sau cel mult egal cu valoarea 0. indică în ce măsură ne înşelăm atunci când afirmăm ceva. Dacă dorim însă să avem mai multe şanse în a demonstra ceva şi consecinţele nu sunt grave în caz de greşeală. În cercetarea ştiinţifică se lucrează de obicei cu două praguri de semnificaţie. În testarea acestor ipoteze probabilitatea de eroare de 1% sau 5% se împarte la cele extremităţi (cozi) ale distribuţiei scorurilor. 267 . atunci se preferă pragul de eroare de 5% (deci un p=0. corespunzătoare procentajului de eroare: pragul de 0. Astfel. Pentru aceste ipoteze probabilitatea de eroare se stabileşte la una dintre extremităţile distribuţiei. În cazul corelaţiei. iar situaţia II corespunde ignoranţei.050). indică dacă există o legătură între două sau mai multe variabile. În psihologie se lucrează cu două modalităţi de formulare a ipotezelor (non-direcţionale sau direcţional). fie y poate fi cauză pentru x. corelaţia pozitivă poate lua valori de la 0 la 1. Există trei modalităţi de interpretare a unui coeficient de corelaţie obţinut între două variabile (x şi y): fie x poate fi cauză pentru y. Dacă vrem să evităm primul tip de greşeală care are consecinţe mai grave (de a demonstra ceva ce nu există în realitate). scorurile medii la prima variabilă se asociază cu scoruri medii la a doua variabilă şi scorurile mari la prima variabilă se asociază cu scoruri mici la a doua variabilă). Analiza corelaţiei dintre două variabile nu permite stabilirea relaţiei de cauzalitate între aceste variabile. iar corelaţia negativă poate lua valori la de -1 la 0. alegem pragul de semnificaţie de 0. Ipotezele direcţionale sunt cele în care se precizează tipul de modificare. ne interesează să ştim în ce măsură rezultatele se datorează întâmplării.05 (5% eroare). Bineînţeles că între variabile poate să nu apară nici o legătură. Ipoteza din exemplul nostru ar putea fi formulată direcţional. În general. Acest coeficient poate lua valori de la -1 la +1. Testul de semnificaţie pentru verificarea acestui tip de ipoteză este TWO-TAILED. Testul de semnificaţie pentru verificarea acestui tip de ipoteză este ONE-TAILED.010 (prag de eroare de 1%). În concluzie. În cazul nostru ipoteza ar putea fi formulată non-direcţional astfel: există o legătură între salariul iniţial şi final al subiecţilor. negativă (când scorurile slabe la prima variabilă se asociază cu scoruri mari la a doua variabilă. Coeficientul de corelaţie (r) indică gradul în care apare paternul unei relaţii între cele două variabile. Pragul de semnificaţie (p) În psihologie este necesară generalizarea concluziile studiilor. pragul de semnificaţie. cercetătorul se aşteaptă la un anumit rezultat.ANALIZA COMPUTERIZATĂ A DATELOR prima variabilă se asociază cu scoruri mari la a doua variabilă). Ipotezele non-direcţionale sunt cele în care nu se precizează tipul de relaţie dintre variabile. Situaţia I corespunde minciunii. Pragul de semnificaţie. p. când se fac predicţii pot să apară patru situaţii.01 (1% eroare) şi pragul de 0. după analiza rezultatelor corelaţiei ne interesează să vedem dacă legătura găsită (la un grup de oameni) poate fi extinsă la întreaga populaţie.

260. 268 . câmpul care prezintă lista variabilelor din baza de date. 582. 1. 625.sav”. 168. 206. 214. 175. 301. 205. 305. 1. câmpul de analiză. 445. 425. 3. 210. 274. 2 (studii medii) şi 3 (studii superioare). 3. 185. 3 • sal_in: 189. 3. 168. 220. 199 Pentru calculul corelaţiei se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE: Activarea comenzii va deschide următoarea fereastră: 1 2 3 4 5 5 Elementele principale ale ferestrei sunt: 1. 197. 185. 298. în câmpul CORRELATION COEFFICIENTS se alege tipul de corelaţie: coeficientul Pearson se foloseşte pentru date parametrice (variabile cantitative şi continui). 392. 1. 332. se pot introduce mai multe variabile. 1. 3. 1. 201. 221. 205. 1. 403. 1. 2. 2. 2. 258. 2.LOREDANA GHERASIM astfel: legătura dintre salariul iniţial şi final este pozitivă. 245 • sal_fin: 201. 502. 178. 2. 156. cu cât salariul iniţial este mai mare cu atât şi salariul final va fi mai mare. 2. 954. 3. 401. Sal_in (salariul iniţial al subiecţilor) şi sal_fin (salariul final al subiecţilor). Calcularea corelaţiei Pearson cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza2. 201. 725. 2. 203. 3. 3. 3. 2. 301. 2. 198. 298. 542. 214. unde se introduc variabilele ce vor fi analizate. 341. 220. 654. 280. coeficienţii KENDALL şi SPEARMAN se folosesc pentru date categoriale şi ordinale. care va cuprinde 3 variabile: STUDII (nivelul de studii al subiecţilor) cu trei valori 1 (studii generale). calculatorul afişând corelaţiile între variabilele luate două câte două. aceste variabile au următoarele valori: • studii:1.

câmpul TEST OF SEGNIFICANCE permite selectarea modului de testate a ipotezei (TWOTAILED sau ONE-TAILED). Se recomandă utilizarea primei variante selectată implicit. 6. Coeficientul de corelaţie Pearson este selectat implicit de către calculator. la fel ca şi celelalte opţiuni test de semnificaţie TWO-TAILED şi marcarea cu asterisc a corelaţiilor semnificative FLAG SIGNIFICANCE CORRELATIONS. opţiunea FLAG SIGNIFICANCE CORRELATIONS are ca efect apariţia unui asterisc (*) în dreptul corelaţiilor semnificative. 5. butonul OPTIONS este urmat de apariţia unei casete de dialog. Aceasta permite realizarea unei analize descriptive a datelor (STATISTICS) şi precizarea modalităţii de tratament a datelor lipsă MISSING VALUES. în foaia OUTPUT sunt afişate următoarele rezultate: 269 .ANALIZA COMPUTERIZATĂ A DATELOR 4. După activarea butonului OK. prin excluderea din analiză a perechilor de rezultate în care avem doar una dintre valori (EXCLUDE CASES PAIRWISE) sau de a exclude din analiză un rând întreg dacă doar una dintre valori lipseşte (EXCLUDE CASES LISTWISE). de obicei se foloseşte pragul TWO-TAILED în testarea ipotezelor de cercetare cu ajutorul SPSS. Vom introduce variabilele SAL_INI şi SAL_FIN în câmpul din dreapta. Pentru baza de date creată vom analiza legătura dintre variabilele salariu iniţial şi final al subiecţilor.

0).30-0. Vom extrage datele pentru legătura dintre salariul iniţial şi salariul final al subiecţilor: Interpretarea corelaţiei: r=0.50.81 (coeficientul de corelaţie).PEARSON CORRELATION se găsesc valorile coeficienţilor de corelaţie dintre două variabile Pe rândul 2 . Pe rândul 1 . În celula din dreapta sus apare coeficientul de corelaţie dintre salariul iniţial şi salariul final (ANX1 şi ANX2).30. Acelaşi rezultate apar şi în celula din stânga jos care prezintă coeficientul de corelaţie dintre salariul final şi salariul iniţial (ANX2 şi ANX1). dar lipsită de semnificaţie (nu apare nici un prag de semnificaţie). astfel. cu un salariu tot mic. • mărimea absolută a coeficientului: descrie tăria legăturii care apare între variabile. că legătura este slabă dacă valoarea absolută a lui r nu depăşeşte 0. Între o variabilă şi ea însăşi apare o corelaţie perfect pozitivă (r=1. după cinci ani. ceea ce înseamnă că un salar iniţial mic se asociază. Rezultatele sunt identice deoarece corelaţie este bidirecţională (corelaţia dintre variabilele A şi B este acelaşi lucru cu cea dintre variabilele B şi A).001 (pragul de semnificaţie). La fel nu se analizează corelaţia dintre variabila salariul final şi salariul final (ANX2 şi ANX2). legăturile puternice având o mărime absolută mai 270 . p<0. un salar iniţial mediu se asociază cu un salar final mediu şi un salar mare iniţial se asociază cu salariu mare final. N=24 (numărul de subiecţi). (2-TAILED) apare probabilitatea de eroare la respingerea ipotezei de nul şi acceptare a ipotezei de cercetare Rândul 3 . Se consideră.LOREDANA GHERASIM 2 4 1 3 5 Se observă că cele două variabile apar pe coloane da şi pe linii. semnul este pozitiv.SIG.N conţine numărul de subiecţi care au scoruri la ambele variabile În tabel apare legătura dintre fiecare variabilă şi ea însăşi (ANX1 şi ANX1 şi respectiv între ANX2 şi ANX2) dar şi legătura dintre cele două variabile (între ANX1 şi ANX2 dar şi între ANX2 şi ANX1). semnificaţia acestuia şi numărul de perechi de scoruri. Sunt mai multe elemente de care trebuie să se ţină seama în interpretarea corelaţiei: • semnul corelaţiei: arată natura legăturii care există pozitive (dacă semnul este pozitiv) sau negative (dacă semnul este negativ). Prima celulă din stânga (notată cu 4) prezintă coeficientul de corelaţie între variabila salariul iniţial şi salariul iniţial (ANX1 şi ANX1). legătura este medie la o valoare a lui r cuprinsă între 0. În consecinţă rezultatul poate fi extras din oricare din cele două celule. Acest coeficient de corelaţie nu aduce nici un fel de informaţie şi în consecinţă nu se analizează. În cazul nostru.

În aceste situaţii se raportează un p<0.001.05. Subiecţii sunt împărţiţi în grupe în funcţie de nivelul de studii (studii). În dreapta ferestrei apar mai multe opţiuni.1% (calculatorul ne afişează doar primele trei zecimale). tăria legăturii este ridicată (r=0. vrem să vedem dacă legătura dintre salariul iniţial şi salariul final are aceeaşi valoare la subiecţii care au studii generale. Proporţia de varianţă indică la ce procent din populaţia generală apare relaţia. Spre exemplu. atunci putem considera că există o relaţie între variabilele studiate.ANALIZA COMPUTERIZATĂ A DATELOR mare de 0. se foloseşte comanda SELECT CASES din meniul DATA. Pentru a selecta numai subiecţii care au studii generale. Se observă că abia 65% din variaţia observată se întâlneşte în realitate.05.50. care deschide următoarea casetă de dialog: 271 . valoarea este 0. fiind codificaţi cu 1 în baza de date. Toate aceste elemente trebuie să apară în interpretare. Comanda SELECT CASES Uneori este necesară selectarea anumitor cazuri din populaţie pentru a face o prelucrare statistică. Pentru exemplu nostru proporţia de varianţă are valoarea 0. deci relaţia găsită este prezentă la 65% dintre subiecţi. • proporţia de varianţă.65). pragul de semnificaţie fiind mai mic de 0. pentru ca ea să fie completă. Putem spune că există o legătură semnificativă între nivelul iniţial şi final al salariului subiecţilor. Coeficientul de corelaţie ridicat la pătrat ne indică proporţia de varianţă explicată de relaţia găsită.81.000. În exemplul nostru. Pe noi ne interesează opţiunea IF CONDITION IS SATISFIED. Activarea meniului este urmată de apariţia următoarei ferestre: În câmpul din stânga al ferestrei sunt prezentate toate variabilele din baza de date. pentru a arăta că probabilitatea de a greşi este mai mică decât 0. deci r2=0.50 • pragul de semnificaţie dacă este mai mic de 0. Această opţiune se alege cu un simplu click stânga al mouse-ului: Se activează butonul IF. În exemplu nostru.81) coeficientul având valoare mi mare de 0.65 (r=0. deoarece vrem să selectăm numai cazurile care îndeplinesc o anumită condiţie (să aibă valoarea 1 la variabila studii adică să fie numai subiecţi cu studii generale).

LOREDANA GHERASIM Se selectează variabila în funcţie de cre se face selecţia şi se trece în câmpul dintre dreapta sus. baza de date modificându-se. Se poate folosi tastatura sau se pot activa butoanele cu cifre şi semne ce se găsesc sub acest câmp. variabila Studii trebuie să aibă numai valoarea 1 (STUDII=1). Pentru exemplul nostru. În cazul nostru se selectează variabila STUDII şi se trece în câmpul din dreapta: Se adăugă condiţia. Condiţia va arăta astfel: Se apasă apoi butonul CONTINUE pentru a salva condiţia: Se activează butonul OK. cum se poate observa şi în imaginea de mai jos: 272 .

În cazul nostru trebuie utilizată comanda de analiză a corelaţiei dintre salariul iniţial şi cel final. deci nu există o legătură semnificativă între salariul iniţial şi final al subiecţilor care au studii generale. salariul iniţial mare se asociază cu un salar final mare.47. În partea din dreaptajos a ecranului apare anunţul FILTER ON. • proporţia de varianţă explicată de relaţia este r2=0. p=0. adică ele vor fi ignorate de la analiză. Explicaţia lipsei de semnificaţie a corelaţiei dintre cele două variabile (în condiţiile în care coeficientul de corelaţie are valoare ridicată) este numărul mic de subiecţi. intitulată FILTER_$.050. Se obţine următorul tabel în fereastra cu rezultate: Rezultatul obţinut este următorul: r=0. Numărul de subiecţi din analiză influenţează valoarea pragului de semnificaţie al corelaţiei dar nu şi puterea legăturii dintre variabile. • mărimea absolută a coeficientului: puterea legăturii dintre cele două variabile este ridicată. salariul iniţial mediu se asociază cu un salar final mediu. În continuare vom interpreta aceste rezultate: • semnul corelaţiei: corelaţie pozitivă. • pragul de semnificaţie: valoarea pragului de semnificaţie este mai mare de 0. legătura este direct proporţională. După selecţie trebuie făcută prelucrarea statistică a datelor. care avertizează utilizatorul cu privire la activarea unei comanzi de selecţie Atenţie! Selectarea datelor nu implică şi efectuarea analizei statistice.ANALIZA COMPUTERIZATĂ A DATELOR La sfârşitul bazei de date apare o nouă variabilă.50. valoarea lui r depăşeşte valoarea de 0. 273 . care indică rezultatul selecţiei. Cazurile neselectate sunt “tăiate”. deci relaţia găsită apare la 47% dintre subiecţii cu studii generale. În cazul subiecţilor cu studii generale se constată că nivelul mic al salariului iniţial se asociază cu un nivel mic al salariului final.056.69.

astfel.LOREDANA GHERASIM După folosirea acestui “filtru” este indicată dezactivarea.sav. Rezultatele analizei statistice sunt prezentate separat. În partea de jos a ferestrei se găseşte buton RESET. comanda de filtrare a datelor dispare. Activarea comenzii SPLIT FILE deschide următoarea fereastră: Dintre opţiunile din dreapta alegem ORGANIZE OUTPUT BY GROUPS şi apoi. în partea dreaptă-jos a bazei de date apare anunţul SPLIT FILE ON. Pentru dezactivarea selecţiei. trebuie folosită comanda CORRELATIOS pentru a analiza legătura dintre variabilele salariu iniţial şi final al subiecţilor. De aceea. Pentru a nu repeta comanda SELECT CASES de multe ori se poate utiliza o altă comandă din meniul DATA.SELECT CASES. care avertizează utilizatorii că baza de date este împărţită în funcţie de condiţiile (nivelurile) variabilei de grupare . cu ajutorul săgeţii. Se activează apoi butonul OK. se deschide din nou în meniul iniţial DATA . în fişierul OUTPUT. La fel ca şi în cazul comenzii SELECT CASES. şi anume comanda SPLIT FILE. Comanda SPLIT FILE Uneori însă dorim să vedem ce se întâmplă pentru fiecare subgrup de subiecţi în parte. Pentru baza de date BAZA2. introducem variabila de grupare (STUDII) în câmpul care se activează sub această opţiune: După apăsarea butonului OK. medii şi superioare: 274 . simpla împărţire a bazei de date nu asigură prelucrarea statistică. pentru fiecare condiţie a variabilei independente: studii generale. vom analiza legătura dintre variabilele salariul iniţial şi salariul final pentru toate categoriile de subiecţi în funcţie de variabila STUDII (nu numai pentru subiecţii cu studii generale dar şi pentru cei cu studii medii şi superioare).

ANALIZA COMPUTERIZATĂ A DATELOR nivelul de studii al subiecţilor = studii generale nivelul de studii al subiecţilor = studii medii nivelul de studii al subiecţilor = studii superioare Graficul corelaţiei Relaţia dintre două variabile poate fi reprezentată grafic sub forma unui nor de puncte. care să ilustreze relaţia dintre două variabile. Practic. Se activează apoi butonul DEFINE. care deschide fereastra: Vom alege un grafic simplu. comanda SCATTER. graficul îl alegem din meniul GRAPHS. deci vom selecta opţiunea SIMPLE. care deschide următoarea fereastră: 275 .

Pentru exemplul nostru norul de puncte este ascendent crescător (din stânga-jos spre dreapta-sus) deoarece relaţia dintre variabile este pozitivă.81). grupate deoarece coeficientul de corelaţie are valoare ridicată (r=0.LOREDANA GHERASIM Se introduc cele două variabile în câmpurile axei X şi axei Y (nu contează ordinea în care se introduc variabilele deoarece corelaţia este bidirecţională) şi apoi se apasă butonul OK. iar punctele sunt apropiate. Reprezentarea grafică a corelaţiei este următoarea: Reprezentarea grafică a corelaţiei apare sub forma unui nor de puncte. Dacă relaţia ar fi fost invers proporţională. norul de puncte ar fi fost orientat 276 .

Calcularea corelaţiei Kendall cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza3. apoi se introduc variabilele prof_1 şi prof_2 în câmpul din dreapta.ANALIZA COMPUTERIZATĂ A DATELOR descrescător (din stânga-sus spre dreapta-jos). semnul coeficientului de corelaţie Kendall's tau-b indică direcţia relaţiei. care va cuprinde 3 variabile: elevi (codul de identificare al elevilor). COEFICIENTUL DE CORELAŢIE KENDALL'S TAU-B Reprezintă o măsură non-parametrică a asocierii variabilelor ordinale sau rangate care presupun cantităţi. iar valoarea absolută a coeficientului indică puterea relaţiei. punctele ar fi fost distribuite uniform pe grafic.sav”. În tabelul următor prezentăm valorile acestor variabile. Prof_1 (evaluarea interesului elevilor faţă de şcoală de către primul profesorul) şi Prof_2 (evaluarea interesului elevilor faţă de şcoală realizată de al doilea profesor). La fel ca şi în cazul corelaţiei Pearson. Din câmpul CORRELATION COEFFICIENTS se bifează coeficientul de corelaţie Kendall's: După confirmarea comenzii în foaia cu rezultate apare următorul tabel: 277 . II. Pentru calculul acestei corelaţii se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE. Pentru a analiza legătura dintre evaluarea făcută de primul profesorul şi evaluarea realizată de al doilea profesor (prof_1 şi prof_2). trebuie să folosim coeficientul de corelaţie Kendall's.5. În cazul în care nu ar fi nici o relaţie. Cu cât valoarea coeficientului este mai mare cu atât relaţia dintre variabile este mai mare. Acest coeficient de corelaţie poate lua valori doar intre -1 şi 1.

al treilea). II. Această evaluare presupune atribuirea de valori care indică ierarhia subiecţilor (cum ar fi primul. Asocierea nu este însă semnificativă. elevii clasaţi pe primele locuri de către primul profesor ocupă tot o poziţie fruntaşă din perspectiva celui de al doilea profesor. al doilea. COEFICIENTUL DE CORELAŢIE SPEARMAN Este o măsurare non-parametrică a corelaţiei dintre două variabile ordinale. Se introduc variabilele eval_i şi eval_re în câmpul din dreapta. Pentru toate cazurile. de la cele mai mici la cele mai mari.6. în asemenea manieră încât indivizii statistici să fie ordonaţi în funcţie de două criterii X şi Y. p=0. Dacă ar fi apărut o asociere negativă dintre variabile (coeficientul de corelaţie ar fi fost negativ) s-ar fi interpretat astfel: elevii plasaţi pe primele locuri de către primul profesor s-ar fi plasat în coada clasamentului din perspectiva celui de al doilea profesor.sav”. Acest coeficient de corelaţie mai este denumit şi coeficient de corelaţie a rangurilor. Pentru calculul acestei corelaţii se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE. Calcularea corelaţiei Spearman cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza4. care va cuprinde 3 variabile: elevi (codul de identificare al elevilor).60). Pentru a analiza legătura dintre evaluarea interesului faţă de şcoală al elevilor şi evaluarea relaţiilor cu ceilalţi colegi (eval_i şi eval_re) se foloseşte coeficientul de corelaţie Spearman. Din câmpul CORRELATION COEFFICIENTS se bifează coeficientul de corelaţie Spearman: 278 . valorile fiecărui tip de variabilă sunt rangate. Modalitatea de calcul a corelaţiei Spearman este similară coeficientului Pearson (de fapt de aplică formula coeficientului Pearson). Se foloseşte atunci când nu este posibilă măsurarea caracteristicilor analizate ci doar evaluarea lor. eval_i (evaluarea de către profesori a interesul pentru şcoală) şi eval_re (evaluarea de către profesori a relaţiilor cu ceilalţi elevi).091 posibila explicaţie fiind numărul mic de subiecţi din baza de date.LOREDANA GHERASIM Se constată că apare o asociere pozitivă între variabile (r=0.

050 (p=0.79.sav) care conţine mediile obţinute de elevi la sfârşitul anului şcolar. 9. relaţii bune cu ceilalţi elevi. Deci vom calcula mai întâi valoarea medianei şi apoi vom împărţi subiecţii în grupe în funcţie de valoarea acestui indicator.81.78. 7. pragul de semnificaţie fiind mai mare de 0.7. 8.88.06.91.49.54 Vom împărţi elevii în două grupe (grupul elevilor cu performanţe bune şi grupul elevilor cu performanţe slabe).06. 8.88. Inversarea clasamentului nu este semnificativă. II. acest indicator statistic împărţind şirul de scoruri în două parţi egale (proba medianei). prin crearea unei noi variabile în baza de date sau modificarea valorilor unei variabile existente în baza de date.71. ceea ce semnifică faptul că elevii plasaţi pe primele locuri ale variabilei interes pentru şcoală ocupă ultimele locuri după cel de al doilea criteriu.16. 7. RECODIFICAREA ŞI TRANSFORMAREA VARIABILELOR Uneori este necesar ca scorurile brute obţinute de subiecţii unui studiu să fie transformate pentru a putea verifica ipoteza studiului. 7. 9. 7. 9. 8.81. 6. Valorile variabilei sunt: Media: 8. 7.06.04. Aplicaţia SPSS are o serie de comenzi care permit transformarea sau recodificarea unei variabile cantitative într-o variabilă calitativă.76. 6.73.80. Pentru calculul medianei vom folosi comanda DESCRIPTIV STATISTICS– FREQUENCIES: 279 . 9. 7.ANALIZA COMPUTERIZATĂ A DATELOR După confirmarea comenzii în foaia cu rezultate apare următorul tabel: Se constată că apare o inversare a clasamentului. 7. corelaţia având semn negativ. 8. 8. 7. 7.69.86.260). Împărţirea elevilor în două grupe se realizează în funcţie de mediană. Pentru a exemplifica utilizarea comenzilor de recodificare vom crea o nouă bază de date (baza5. 8. 6.03.19.10. 9.49.

Comanda RECODE INTO DIFFERENT VARIABLES Selectăm opţiunea de creare a unei noi variabile care să cuprindă grupele obţinute în urma recodificării. în câmpul din mijloc al ferestrei cu ajutorul butonului de trecere. în câmpul NAME de la OUT VARIABLE se introduce numele variabilei create. Vom denumi noua variabilă NIVPERF. Se selectează opţiunea INTO DIFFERENT VARIABLES. iar subiecţii care au valori mai mari decât mediana vor forma grupul celor cu performanţe ridicate. Subiecţii care au valori mai mici ca mediana (7. câmpul care conţine variabilele din baza de date.LOREDANA GHERASIM Pentru exemplul nostru mediana are valoare 7. 2. ceea ce are ca urmare apariţia următoarei casete de dialog: 3 1 2 5 4 1. Se poate păstra variabila ce urmează să fie recodificată (INTO SAME VARIABLES) sau se poate crea o nouă variabilă (INTO DIFFERENT VARIABLES). 3 în câmpul INPUT VARIABLE →OUTPUT VARIABLE se introduce atât variabila ce urmează să fie recodificată cât şi numele noii variabile.95) vor forma grupul celor cu performanţe scăzute. butonul OLD AND NEW VALUE permite recodificarea variabilei iniţiale 5 butonul IF permite crearea unei noi variabile doar prin selecţia anumitor valori ale variabilei iniţiale Pentru exemplul nostru vom trece variabila pe care dorim să o recodificăm.95. MEDIA. Pentru recodificarea variabilei MEDIA se utilizează opţiunea RECODE care se găseşte la meniul TRANSFORM: Comanda RECODE are două opţiuni de recodificare. Noul nume se tastează în câmpul NAME al câmpului OUTPUT VARIABLE: 280 . 4.

LOWEST THROUGH din câmpul OLD VALUE şi vom trece în câmpul activat valoarea medianei (7.95) vor forma grupul subiecţilor cu performanţa scăzută. câmpul NEW VALUE face referire la valorile noii variabile 3.95). subiecţii care au obţinut scoruri mai mici decât mediana (7. Astfel. În consecinţă. în câmpul de lângă opţiunea VALUE. vom tasta valoarea 1: 281 . vom activa opţiunea RANGE. Activarea acestui buton deschide următoarea casetă de dialog: 2 1 3 Această fereastră prezintă mai multe câmpuri: 1. Cu alte cuvinte această opţiune va însemna că toate valorile variabilei MEDIA mai mici de 7. prind valoarea în cadrul noii variabile NIVPERF. formând o nouă variabilă.ANALIZA COMPUTERIZATĂ A DATELOR Pentru ca noul nume al variabilei să apară în câmpul din mijloc INPUT VARIABLE →OUTPUT VARIABLE şi astfel să aibă loc recodificarea.95 vor fi recodificate. câmpul OLD VALUE se referă valorile variabilei iniţiale 2. în câmpul OLD→NEW se reunesc opţiunile de recodificarea a variabilelor În exemplul nostru. În câmpul NEW VALUE. trebuie ca valorile variabilei MEDIA (variabila iniţială) să le redefinim. se activează butonul CHANGE din câmpul OUTPUT VARIABLE: Se activează butonul OLD AND NEW VALUE pentru a defini valorile noii variabile. care va reprezenta valoarea 1 a variabilei NIVPERF (ce va fi creată).

Pentru a fi reţinută şi această a doua condiţie de recodificare.95). mai întâi trebuie să calculăm valorile corespunzătoare percentilelor care împart şirul de scoruri în 3 parţi egale (fiecare parte reprezentând 33.64 vor forma grupul subiecţilor cu performanţă de nivel mediu (grupul 2).95 ale variabilei MEDIA vor reprezenta valoarea 2 al variabilei NIVPERF. a doua treime grupul subiecţilor cu performanţă medie. În concluzie. ceea ce duce la modificarea bazei de date. Subiecţii cu valori mai mici de 7. Această opţiune va însemna că valorile mai mari de 7.66%). Există posibilitatea de a împărţi valorile unei variabile în mai mult de două grupe. Pentru exemplificare vom împărţi scorurile la variabila MEDIA în trei parţi egale. se acţionează din nou butonul ADD din câmpul OLD→NEW. Se observă că în baza de date apare noua variabilă NIVPERF.95 ale variabilei MEDIA vor primi valoarea 1 în cadrul variabilei NIVPERF. Se foloseşte comanda DESCRIPTIV STATISTICS– FREQUENCIES. după cum se poate observa şi în imaginea din dreapta. cum se poate observa şi în imaginea din mai jos. în câmpul de lângă opţiunea VALUE. iar cei cu medii mai mari de 8. vom tasta valoarea 2.33% şi 66. Apoi se activează opţiunea RANGE. Din câmpul PERCENTILE VALUES se bifează opţiunea PERCENTILE şi se introduc centilele care împart şirul de scoruri în 3 parţi egale (adică 33.95 ale variabilei MEDIA vor fi recodificate în variabila NIVPERF primind valoarea 2. Puteţi verifica dacă recodificarea a fost corect realizată. THROUGH HIGHEST din câmpul OLD VALUE şi se trece în câmpul activat valoarea medianei (7. pentru a putea recodifica următoarele valori. imaginea din stânga.64 vor reprezenta grupului cu performanţa ridicată (grupul 3).73 vor forma grupul celor cu performanţa scăzută (grupul 1). În consecinţă.73 şi 8. cu două valori. scorurile mai mici de 7. Prima treime va alcătui grupul subiecţilor cu performanţă scăzută. Pentru a putea face împărţirea. iar valorile mai mari de 7. Se activează apoi butonul CONTINUE şi butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES. în câmpul NEW VALUE.LOREDANA GHERASIM Se apasă apoi butonul ADD al câmpului OLD→NEW. 282 . iar ultima treime grupul subiecţilor cu performanţă ridicată.33% din total). cei cu valori cuprinse între 7.

Se activează prima opţiune RANGE THROUGH şi se tastează valorile minime şi maxime.73. cu trei valori.64 vor reprezenta nivelul 2 al variabilei NIVPERF2. În câmpul NEW VALUE se trece valoarea 3. Se activează apoi butonul ADD al câmpului OLD→NEW. Vom denumi noua variabila NIVPERF2. Se activează apoi butonul CONTINUE şi butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES. cum se poate observa şi în imaginea alăturată. Pentru exemplificare vom utiliza aceeaşi bază de date (baza5. apoi se activează butonul ADD. care cuprinde valori mai mari de 8. Valorile variabilei MEDIE cuprinse între 7. În acest exemplu.73 ale variabilei MEDIA vor forma primul grupului 1. pentru a putea introduce următoarea condiţie. Vom activa opţiunea RANGE. Activăm apoi butonul ADD al câmpului OLD→NEW. tastând noul nume în câmpul NAME al câmpului OUT VARIABLE şi apoi activând butonul CHANGE. iar în câmpul NEW VALUE vom trece valoarea 1. Comanda RECODE INTO SAME VARIABLES Rezultate similare se obţin dacă se utilizează comanda RECODE opţiunea INTO SAME VARIABLES.ANALIZA COMPUTERIZATĂ A DATELOR Pentru a crea această nouă variabilă se activează meniul TRANSFORM – RECODE . În câmpul NEW VALUE se trece valoarea 2. adică nivelul 1 al noii variabile NIVPERF2.64 se activează opţiunea RANGE. ceea ce duce la modificarea bazei de date.73 şi 8. Activarea comenzii duce la apariţia casete de dialog: 283 . scorurile mai mici de 7. THROUGH HIGHEST din câmpul OLD VALUE. cu excepţia faptului că se păstrează numele iniţial al variabilei recodificate.INTO DIFFERENT VARIABLES. Pentru crearea ultimului grup. cum se poate observa şi în imaginea alăturată: Se observă că în baza de date apare noua variabilă NIVPERF2. LOWEST THROUGH din câmpul OLD VALUE şi vom trece în câmpul activat valoarea 7.sav) şi vom împărţi în două scorurile subiecţilor.

care are aceleaşi opţiuni ca în cazul opţiunii anteriore de transformare într-o variabilă diferită: Recodificare se realiză la fel ca în exemplu anterior. Trecem variabila în câmpul din dreapta: Se activează butonul OLD AND NEW VALUES. În exemplu nostru vrem să recodificăm variabil Media. în câmpul din dreapta se introduc variabilele pe care dorim să le recodificăm. când am utilizat opţiunea de recodificare într-o altă variabilă: 284 .LOREDANA GHERASIM În câmpul din stânga apar toate variabilele din baza de date.

Pentru a vedea atitudinea subiecţilor faţă de instituţiile statului ar trebui să însumăm răspunsurile subiecţilor de la cei 3 itemi. PARLAM (Câtă încredere aveţi în parlament?). subiecţii au răspuns pe o scală de la 1 (foarte mult) la 4 (foarte puţin). Acest lucru demonstrează că cele două opţiuni duc la acelaşi rezultat. aceasta având acum aceleaşi valori ca şi variabila NIVPERF.sav) care conţine patru variabile: NRCHEST (codul de identificare). Se constată că s-au modificat valorile variabilei MEDIA. Pentru a putea face 285 . Prezentăm scorurile obţinute de 16 dintre subiecţi. PRES (Câtă încredere aveţi în preşedinte?). GUV (Câtă încredere aveţi în guvern?). însă. Inversarea valorilor variabilelor Comanda de recodificare poate fi utilizată şi pentru recodificarea valorilor scorurilor obţinute la diferiţi itemi.ANALIZA COMPUTERIZATĂ A DATELOR După confirmarea recodificării să vedem modificările din baza de date. Pentru itemii 1 şi 3 subiecţii au răspuns pe o scală de la 1 (foarte puţin) la 4 (foarte mult). La itemul 2. Pentru a exemplifica utilizarea acestor comenzi de recodificare vom crea o nouă bază de date (baza6.

valoarea 1 a vechii variabile devine 4 pentru noua variabilă. pentru ca scala de evaluare să aibă aceeaşi semnificaţie cu a ceilalţi doi itemi (valoarea 1 să însemne foarte puţin iar valoare 4 să însemne foarte mult). Pentru inversarea scalei de evaluare a itemului vom folosi numai opţiunile VALUE din câmpul OLD VALUE şi NEW VALUE. valoarea 2 să devină 3. deci se tastează 1 în dreptul opţiunii VALUE din câmpul OLD VALUE şi cifra 4 în dreptul opţiunii VALUE din câmpul NEW VALUE. Pentru recodificare ar putea fi utilizată oricare dintre cele două opţiuni prezentate anterior RECODE INTO SAME VARIABLES sau INTO DIFFERENT VARIABLES. În final trebuie să avem următoarele transformări în câmpul OLD→NEW: 286 . Se activează butonul ADD din câmpul OLD→NEW. Apoi se tastează 2 în câmpul de la opţiunea VALUE din câmpul OLD VALUE şi cifra 3 în câmpul de la opţiunea VALUE din câmpul NEW VALUE: La fel se procedează şi pentru celelalte valori care trebuie recodificate.LOREDANA GHERASIM acest lucru ar trebui ca răspunsurile de la itemul 2 să fie transformate. Recodificarea în acest caz presupune inversarea scalei de evaluare pentru itemul 2. iar valoarea 4 a itemului să devină 1 (ceea ce înseamnă foarte puţin). adică valoarea 1 a itemului să devină 4 (ceea ce înseamnă foarte mult). Vom folosi comanda RECODE INTO DIFFERENT VARIABLES pentru a putea verifica dacă recodificarea a fost realizată. Vom redenumi variabila recodificată GUV_R: Vom activa butonul OLD AND NEW VARIABLES. Astfel. valoarea 3 să devină 2.

ANALIZA COMPUTERIZATĂ A DATELOR După activarea butonului CONTINUE şi butonului OK al ferestrei principale. opţiunea COMPUTE: 3 1 2 Prezentăm caracteristicile principale ale acestei ferestre: 1. trebuie să însumăm scorurile subiecţilor obţinute la cei trei itemi. în câmpul TARGET VARIABLE se tastează numele noii variabile 2. baza de date va conţine o nouă variabilă (GUV_R) care conţine valorile inversate ale itemului 2: Comanda TRANSFORM COMPUTE Pentru a calcula scorul total la atitudinea faţă de instituţiile statului. în acest câmp sunt prezentate variabilele din baza de date 287 . Pentru a putea face acest lucru se foloseşte meniul TRANSFORM.

LOREDANA GHERASIM 3. deci vom tasta numele noii variabile în câmpul TARGET VARIABLE: Apoi vom scrie formula de calcul care va consta în însumarea scorurilor obţinute la cele trei variabile: PRES. cu numele ATIT. Pentru exemplu nostru vom numi noua variabila ATIT. GUV_R şi PARLAM. 288 . în câmpul NUMERIC EXPRESSION se introduce formula de calcul a noii variabile. Această nouă variabilă reprezintă atitudinea subiecţilor faţă de instituţiile statului şi reprezintă suma răspunsurilor la cei trei itemi. sub acest câmp se găsesc butoane cu cifre şi semne. Variabile sunt trecute în câmpul NUMERIC EXPRESSION folosind butonul de trecere. dar şi un câmp cu funcţii complexe care pot fi utilizate pentru calculul noilor variabile. Semnul plus se introduce de la tastatură sau folosind butoanele care se găsesc sub câmpul NUMERIC EXPRESSION: După activarea butonului OK în baza de date apare o nouă variabila.

Există o strânsă legătură între scorurile standard (notele z) şi diferite procentaje sau frecvenţe relative. doar aproximativ 2% dintre indivizi vor avea scoruri şi mai extreme. înclinarea (indică tendinţa scorurilor de a fi mai mari sau mai mici) şi turtirea (arată cât de mult variază scorurile distribuţiei). curba normală mai posedă anumite proprietăţi speciale. iar deviaţia standard este 16. să luăm drept exemplu distribuţia rezultatelor la un test de inteligenţă. Observaţi. de asemenea. Cunoscând nota Z a unui subiect putem şti cu precizie câţi indivizi din populaţie au scoruri mai 289 . În imaginea de mai jos ilustrăm grafic această distribuţie: 34% 14% 2% Scoruri brute Scoruri z 68 -2 84 -1 100 0 34% 14% 2% 116 +1 132 +2 Dacă urmăriţi cu atenţie forma curbei normale veţi constata prezenţa unor „puncte de inflexiune”. Aproximativ 34% din cazuri se vor afla între medie şi o abatere standard la stânga sau la dreapta mediei. Astfel. simetrică şi mediu turtită. În plus. exact 50% din cazuri vor avea scoruri sub valoarea medie. Există trei parametri ai unei distribuţii: modalitatea (indică valorile în jurul cărora se grupează scorurile subiecţilor). Având o deviaţie standard de 16. numai 16% dintre oameni au coeficientul de inteligenţă mai scăzut de 84 sau mai ridicat de 116. Abia 16% din populaţie vor avea scoruri mai mici sau mai mari de o deviaţie standard. Mai mult.1. Aceste puncte corespund deviaţiilor standard. ELEMENTE DE STATISTICĂ INFERENŢIALĂ III. iar acest lucru poate fi demonstrat matematic. La acest test media rezultatelor este 100. vom şti că 34% dintre subiecţi au scoruri cuprinse între medie (100) şi o deviaţie standard. Dacă un fenomen social observat este urmărit o perioadă de timp mai îndelungată. Din perspectiva celor trei parametri. matematicienii au pus la punct formule care permit calcularea diferitelor suprafeţe ale curbei. distribuţia rezultatelor se va face după o curbă normală. Pentru a înţelege mai uşor despre ce este vorba. vom şti că 34% dintre indivizi vor avea scorul cuprins între 100 şi 116 (cei cu IQ situat deasupra mediei) sau între 84 şi 100 (cei cu IQ situat dedesubtul mediei). DISTRIBUŢIA NORMALĂ Variabilitatea rezultatelor urmează reguli care pot fi modelate matematic.ANALIZA COMPUTERIZATĂ A DATELOR III. Întrucât distribuţia normală este simetrică. Cu alte cuvinte. că şi mai puţine cazuri sunt mai depărtate de medie. mai mici sau mai mari decât două deviaţii standard faţă de medie (adică sub valoarea 68 sau peste valoarea 132). curba normală este unimodală. puncte în care linia curbă îşi modifică forma. Astfel.

Astfel. în exemplul nostru avem de comparat două populaţii: P0 – populaţia copiilor 290 . în populaţia normală este de 14 luni. care arată câţi subiecţi au scorurile cuprinse între medie şi nota Z. Unul dintre efecte este scăderea vârstei la care copii încep să meargă. după administrarea vitaminei.LOREDANA GHERASIM mici sau mai mari decât al subiectului investigat. pentru fiecare notă Z. ETAPELE TESTĂRII UNEI IPOTEZE. dar pentru aceasta ei trebuie să demonstreze că într-adevăr vitamina accelerează mersul copiilor.56 (după formula: (125-100)/16).2.06% (50%+44. trebuie să facem apel la distribuţia normală a variabilei alese în cadrul populaţiei şi să respectăm anumite etape pentru verificarea raţionamentului. aceştia dezvoltându-se mai rapid.06% dintre subiecţi. Aceasta înseamnă că de la medie (100) şi până la scorul nostru (125) sunt 44. Să presupunem că o persoană obţine la testul de inteligenţă scorul 125. Deşi avem doar un singur caz pe care trebuie să îl comparăm cu o populaţie ai cărei parametri sunt cunoscuţi. care are valoarea 1.06%. ipotezele trebuie reformulate în termenii generali ai populaţiilor de comparat pentru a putea face generalizarea ulterioară. Aceasta arată că doar 5. cu o abatere standard de 3 luni? Pentru a răspunde cu dovezi statistice la o astfel de întrebare. TESTUL Z Pentru a vedea cum se realizează inferenţa statistică. ştiind că vârsta la care merg copii prima dată. este precizat un procent. Copilul respectiv. Pot farmaciştii să susţină că vârsta precoce la care a mers copilul se datorează vitaminei. Farmaciştii au primit dreptul să administreze vitamina unui singur copil nou-născut. 1995). Ca exemplu vom folosi un studiu (Aron & Aron. Prezentăm în continuare curba normală corespunzătoare vârstei de debut de la care copiii încep să meargă: 34% 14% 2% 8 luni 11 luni 34% 14% 2% 14 luni 17 luni 20 luni Pentru testarea ipotezei trebuie să parcurgem mai multe etape: Etapa I: Reformularea problemei în termenii populaţiilor de comparaţie.06%) vor avea scoruri mai mici decât subiectul ales de noi.56 valoarea 44. a început să meargă de la vârsta de 8 luni. în care se compară un eşantion format dintr-un singur caz cu o populaţie a cărei parametri sunt cunoscuţi.94% dintre indivizi vor avea scoruri mai mari (50%-44. vom analiza cel mai simplu test.06%) şi 94. testul z. Farmaciştii au dorit să omologheze vitamina. putem calcula nota Z a acestui subiect. în care un grup de farmacişti a sintetizat o vitamină care accelerează procesele de asimilaţie la copii nou-născuţi. ales aleatoriu din populaţie. III. Dacă vom consulta unul din tabelele de care aminteam anterior. În acel tabel. vom vedea în dreptul lui 1. Orice manual de statistică are la sfârşit un tabel care permite calcularea acestor procentaje cu precizie.

Pragul de semnificaţie poate fi de 1% (când dorim să fim mai precişi) sau de 5% (atunci când putem fi mai puţin exacţi). Există două de valori Z de corespunzătoare pragului 1%. trebuie să vedem care este nota Z corespunzătoare acestuia. una referitoare la scorurile mici (în partea stângă a distribuţiei). H0: P0 = P1 Într-o cercetare se testează de fapt ipoteza de nul pentru că ea descrie situaţia deja existentă înainte intervenţiei sau situaţia în care nu am obţine nici un efect. este testată la un anumit prag de semnificaţie. În cazul nostru colectarea datelor înseamnă a observa vârsta la care va merge copilul pentru prima dată (8 luni). Etapa III: Stabilirea pragului de semnificaţie şi a notei z a punctului de „tăiere”. fără nici o altă intervenţie. Pe noi ne interesează prima dintre aceste valori. Dacă ipoteza de nul este respinsă. Vom formula două ipoteze: Ipoteza de lucru (experimentală): afirmă că noii născuţi care iau vitamina vor merge mai repede decât cei care nu iau vitamina (H1: P0 < P1) Ipoteza de nul: Este ipoteza care descrie situaţia în care intervenţia noastră (vitamina) nu are nici un efect. De exemplu. abia 16% mergând mai târziu de această vârstă. Pentru această cercetare vom stabili un prag de semnificaţie de 1% întrucât efectele ei sunt importante.33) corespunzătoare probabilităţii de 1% (numită şi punct de tăiere). aflate în partea stângă a curbei de distribuţie. Etapa II: Stabilirea parametrilor populaţiei de comparaţie şi a distribuţiei de comparaţie. Orice ipoteză. Vom transforma scorul 291 . După stabilirea pragului. care arată cei 1% dintre copii care merg cel mai timpuriu şi o altă valoare referitoare la scorurile mari (în partea dreaptă a distribuţiei) care arată acei 1% dintre copii care merg cel mai târziu. mai ales în domeniul ştiinţelor sociale. cele două populaţii de copii ar merge la aceeaşi vârstă. Am precizat anterior că fiecărui punct de pe curba de distribuţie normală îi corespunde o anumită notă standard şi o anume distribuţie a cazurilor din populaţie faţă de acel punct. atunci putem accepta ipoteza de lucru. 34% -2. Distribuţia acestei variabile este normală. Acest prag de semnificaţie arată probabilitatea de eroare cu care noi testăm ipoteza. Dacă vitamina nu ar avea nici un efect. copiii din populaţia normală merg la vârsta de 14 luni.ANALIZA COMPUTERIZATĂ A DATELOR normali care nu iau vitaminele şi P1 . Această etapă presupune cunoaşterea parametrilor (media şi abaterea standard) populaţiei la care ne raportăm (în cazul nostru distribuţia copiilor care nu iau vitamina). la o valoare Z de 1 (adică 17 luni) se constată că 84% dintre copii merg la vârste mai mici de 17 luni.populaţia copiilor normali care iau vitaminele. În mod obişnuit. Etapa IV: Colectarea datelor şi transformarea lor în scoruri z. cu o abatere standard de 3 luni. În cazul nostru ea va fi –2.33 pentru că ne referim la scorurile mai mici decât media.33 2% 8 luni 11 luni 34% 14% 2% 14 luni 17 luni 20 luni 14% Note z -2 -1 0 +1 +2 În tabelele statistice găsim valoarea scorului z (z=2.

Vom prezenta în continuare. 1.3. 0.9. Prezentăm în continuare valorile acestor variabile: dens: 94. 1. succint testele de comparaţie cele mai frecvent folosite. 2.3. Cu alte cuvinte.1.8.1. 0. 5. 2.9. 27. 216. 39. care conţine trei variabile: regiune (zona geografică. 1.1. 86.2. 1. 2. 54. 2. III. 105. 3.9. 0. 2. 188. 189. 79. 2. 1. în afară de medie va trebui să estimăm variabilitatea sa. 2. 1.3. 143. 2. 1. 3.3.7. care are valoarea 2. la un prag de probabilitate de 1% că vitamina lor are efectul scontat. 124. 58. 1.1. 3. 0. 1. 1. 2. 4. 36.8. 2-asiatică şi 3-africană).3. 29. 0.5. 0.3.7. 0. 3. 36.1.8. 800. 2. 2. 1.1. 87. 2.8. 3. 2.3? Deoarece nu avem acces la alţi parametri ai populaţiei. 1. 2. acceptăm ipoteza de nul. 102. 0. 1. 1. 0. 221. 283. 0.5.3. 49. 3. 2. -0. -0. ind_d: 0.2. 0. 55. 51. 47. 2. 2.2. 3. 80. Media eşantionului nostru este mai mare sau mai mică comparativ cu cea a populaţiei cu valoarea 2. farmaciştii nu au reuşit să dovedească. 63.4. 3. acesta trebuie comparat cu scorul Z corespunzător punctului de tăiere. În ipoteza noastră experimentală ne aşteptam ca nota Z corespunzătoare scorului brut să fie mai mică decât valoare Z a punctului de tăiere. 3. În consecinţă. 2 Dorim să comparăm scorurile eşantionului la variabila indice demografic cu media populaţiei. 3. 0. 227. 3. După obţinerea scorul Z corespunzător datelor colectate.3. 81. 1. 2.LOREDANA GHERASIM subiectului la variabila vârstă în scor Z. cu valorile: 1europeană. În cazul nostru. nota Z (-2) corespunzătoare scorului brut este mai mare decât a notei Z a punctului de tăiere (–2.5. Am prezentat testul Z pentru a înţelege logica testării ipotezelor şi înţelesul pragului de semnificaţie. 1. 111.5. 3.2. 40. 0.8.4.1. 1. TESTUL T PENTRU COMPARAREA UNUI EŞANTION CU MEDIA POPULAŢIEI Acest test se aplică atunci când dorim să comparăm rezultatele unui eşantion cu media populaţiei (fără să avem informaţii despre varianţa rezultatelor populaţiei). ipoteza experimentală neconfirmându-se.1. 3. ind_d (procentul anual de creştere a populaţiei) şi dens (densitatea populaţiei pe km2). 2.6.33).5. Ipoteza de cercetare: Indicele demografic al eşantionul nostru va avea o avea o valoare diferită de indicele demografic al populaţiei Ipoteza de nul: indicele demografic al eşantionului va avea aceeaşi valoare cu cel al populaţiei Folosirea SPSS pentru compararea unui eşantion cu media unei populaţii Aplicarea testului t se face activând din meniul ANALYZE-COMPARE MERANS opţiunea ONE SIMPLE T TESTS: 292 . 2. 2.9 reg: 1. 1. prin raportare la distribuţia populaţiei normale de comparat folosind formula notei Z (X-M)/SD).3. 330. 3. 102. Pentru a vedea cum anume se foloseşte programul SPSS în această situaţie vom crea o nouă bază de date (baza7.sav). Vom aplica testul t pentru a compara un eşantion cu o populaţie la care cunoaştem media.8. 3. 1.4. 94. 1. adică pentru exemplu nostru: Z=(8-14)/3)=-2 Etapa V: Compararea notei z astfel obţinută cu nota z a punctului de tăiere. 1. 3.

Activare butonului OPTIONS duce la deschiderea următoarei ferestre: Se observă că automat calculatorul a ales un interval de încredere (CONFIDENCE INTERVAL) de 95%.149 3 293 . Deviation 1.3 pentru exemplul nostru). câmpul în care se introduce valoarea medie a populaţiei cu care comparăm eşantionul (cu valoarea 2. 2. pe ecran va apare fereastra de OUTPUT: 1 One-Sample Statistics 2 Std. ceea ce implică un prag de semnificaţie de 5%. câmpul unde vom introduce variabilele pe care vrem să le analizăm 3. Error Mean . După activarea butonului CONTINUE şi apoi a butonului OK al ferestrei principale.489 Std.189 N procentul de crestere anuala a populatiei 37 Mean 1. Nu vom modifica pragul de semnificaţie. câmpul cu toate variabilele din baza de date.ANALIZA COMPUTERIZATĂ A DATELOR După activarea acestei comenzi pe ecran apare următoarea fereastră: 1 3 2 Această fereastră are trei elementele importante: 1.

cuprinde gradele de liberate pentru care a fost calculată valoarea lui t şi probabilitatea de respingere a ipotezei de nul.000. conţine date despre testul t propriu-zis. cu atât putem avea mai multă încredere în rezultatele obţinute. dar se raportează ca un p<0. SD=1. sunt câte elemente pe care de acre trebuie să ţinem seama: • pragul de semnificaţie: care ne indică probabilitatea de eroare atunci când respingem ipoteza de nul.49-2. 8. 5. Pentru a confirma ipoteze de cercetare. ONE SAMPLE STATISTICS.µ m )/ σ m =(1.3 şi abaterea standard (σm) de 0. • sensul diferenţei: este dat de valoarea mediilor comparate sau de semnul notei t şi arată în ce sens apare diferenţa (care medie este mai mare). în cazul nostru df=36 6.3. în această celulă este afişată media eşantionului. • gradul de libertate: arată care este mărimea eşantionului pe care s-a făcut testarea ipotezei. σm=0. populaţie din care provine eşantionul nostru. 7. p<0.05 (adică eroarea nu trebuie să fie mai mare de 5%). Valoarea lui t este obţinută după formula t=(m. pragul de semnificaţie trebuie să fie mai mic sau cel mult egal cu 0. în sensul că media eşantionului nostru este semnificativ mai mică comparativ cu cea a populaţie.1 3. celula conţine diferenţa dintre media eşantionului şi cea a populaţie la care ne raportăm. care ne spune care este probabilitatea cu care greşim dacă respingem ipoteza de nul şi acceptăm ipoteza de cercetare.3 95% Confidence Interval of the Difference Lower Upper -1.428 t procentul de crestere anuala a populatiei -4. mai precis deviaţia standard a populaţiei de eşantioane de aceeaşi mărime cu al nostru (37). celula cuprinde eroarea standard a mediei. Al doilea tabel.195 -. indiferent dacă ele confirmă sau nu ipoteza. nota t a eşantionului nostru comparat la populaţia de eşantioane care are media (µm) 2. prezintă pragul de semnificaţie real. Putem afirmă că 294 .19. Mpop=2.19 4. Cu cât eşantionul este mai mare. conţine elemente de statistică descriptivă.49 2. În continuare vom analiza elementele OUTPUT-ului: 1.1% (calculatorul ne afişează doar primele trei zecimale).000 Mean Difference -. Aceste rezultate indică faptul că diferenţa dintre medii este semnificativă. Primul tabel. prezintă intervalul de încredere al diferenţei dintre cele două medii (-1. Valoarea lui t şi pragul de semnificaţie: t(36)=-4.001.811 4 5 6 7 8 Rezultatele sunt grupate în două tabele. oricare ar fi tipul de test ales. Rezultatele pentru exemplul anterior sunt: Mediile: Meş=1.4. ONE SAMPLE TEST.19≈4.4) corespunzător pragului de semnificaţie de 5%. În exemplu nostru valoarea pragului de semnificaţie este 0. în cazul nostru m=1. Valoarea nu este identică cu cea din tabel datorită aproximărilor făcute.26.294 df 36 Sig. pentru a arăta că probabilitatea de a greşi este mai mică de 0.1 şi -0.LOREDANA GHERASIM One-Sample Test Test Value = 2.3)/0.001.29. în această celulă este afişată abaterea standard a eşantionului. (2-tailed) . În interpretarea statistică a notei t.

pentru a vedea schimbările care apar ca urmare a intervenţiei terapeutice. în final comparându-se rezultatele subiecţilor. Deviation 895.797 Std. Să presupunem că variabila independentă este tipul de feed-back. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE PERECHI În psihologia experimentală se face distincţie între grupele independente şi dependente de subiecţi. (2-tailed) . Nu cunoaştem nivelul mediu anxietăţii populaţie de subiecţi anxioşi înainte de a veni la terapie şi nici nivelul mediu al anxietăţii după terapie. cu două grade de intensitate.643 470. fiecărui grup prezentându-i un grad de intensitate al variabilei independente. Există posibilitatea ca toate nivelurile variabilei independente să fie prezentate aceluiaşi eşantion de subiecţi.251.7.4. avem de a face cu grupe independente de subiecţi. Putem spune că avem densitatea eşantionului studiat de noi este aceeaşi cu cea a populaţiei. Subiecţii cărora le măsurăm anxietatea înainte şi după intervenţia terapeutică formează eşantioane perechi.16. Mpop=90 Valoarea lui t şi pragul de semnificaţie: t(36)=1. subiecţii vor fi împărţiţi în două grupe.9.167 df 36 Sig.ANALIZA COMPUTERIZATĂ A DATELOR procentul de creştere a populaţie eşantionului nostru este mai mic semnificativ în comparaţie cu cel al populaţiei. dacă variabila independentă are două grade de intensitate. cu valoarea 90 (dacă am accepta ipoteza de cercetare am greşi în 25. Astfel.251 Mean Difference 171. p=0. Subiecţii vor fi împărţiţi în două grupe. Aceeaşi subiecţi vor trece prin toate condiţiile experimentale. De exemplu. condiţia de feed-back pozitiv şi respectiv condiţia de feed-back pozitiv. pozitiv şi negativ. măsurăm nivelul anxietăţii subiecţilor înainte şi după terapie. Rezultatele testului ONE SIMPLE T TEST indică următoarele rezultate: One-Sample Statistics Std.797 Mediile: Meş=261. Să analizăm acum dacă scorurile la variabila densitate din eşantionul nostru diferă de cea a populaţiei cu valoarea de 0. Error Mean 147. Rezultatele indică faptul că nu există diferenţe semnificative între densitatea medie a eşantionului şi cea a populaţie. Cea mai simplă situaţie de comparare a eşantioanelor este în situaţia de test-retest. Ceea ce ştim este nivelul anxietăţii subiecţilor care au 295 .153 N Numar de oameni/ kilometru patrat 37 Mean 261. III.096 One-Sample Test Test Value = 90 95% Confidence Interval of the Difference Lower Upper -126. Pentru fiecare nivel al variabilei independente vom avea câte un grup de subiecţi.237 t Numar de oameni/ kilometru patrat 1. Atunci când cercetătorul împarte subiecţii în grupe în funcţie de variabila independentă.1% din cazuri). Fiecare subiect va face parte dintr-un singur grup experimental. În această situaţie vom avea grupe perechi sau dependente de subiecţi.

Ipoteza de nul: diferenţele dintre cele două măsurători sunt nule. Ceea ce ne interesează pe noi este de fapt diferenţa dintre cele două măsurători ale anxietăţii. Ipoteza de cercetare: susţine că vor fi diferenţe între cele două măsurători. ne aşteptăm ca nivelul anxietăţii după terapie să fie mai mic decât cel iniţial. pentru că avem rezultatele aceloraşi subiecţi înainte şi după terapie. variabilele selectate pentru analiză. Folosirea SPSS pentru compararea a două eşantioane perechi Pentru a demonstra modul de utilizare a testului t pentru eşantioane perechi. înainte şi după intervenţia terapeutică. nu există nici o diferenţă între nivelul iniţial şi cel final al anxietăţii. câmpul în care se introduc cele două variabile pereche După introducerea variabilelor în câmpul de analiză fereastra ar trebui să arate astfel: 296 . pentru acest tip de test se selectează o pereche de variabile. Aplicarea testului t se face activând din meniul ANALYZE – COMPARE MEANS opţiunea PAIRED-SAMPLES T TEST: Odată activată comanda va apare fereastra de mai jos: 1 2 3 Prezentăm principalele opţiuni ale ferestrei: 1. vom folosi baza de date Baza1. câmpul din stânga cuprinde variabilele din baza de date 2. înainte şi după terapie. 3. indică selecţia curentă.LOREDANA GHERASIM venit la terapie. Se utilizează testul t pentru eşantioane perechi. Diferenţele dintre mediile celor două eşantioane vor forma un eşantion de comparaţie.sav. Acest eşantion al diferenţelor se compară cu o populaţie la care cunoaştem media (media are valoarea 0 conform ipotezei de nul).

9940 2.259 Sig.1. conţine perechea de variabile analizată.05 anxietatii dupa tera 14 15 Rezultatele sunt organizate în trei tabele.3454 1. conţine deviaţiile standard a scorurilor fiecărui eşantion: Sini=60.nivelul -0. Sfin=5. Deviation Mean Lower Upper 8.9000 107. Deviation 6.0111 -4. Vom păstra intervalul de încredere de 95%. pentru fiecare dintre acestea vom analiza celulele. Tabelul PAIRED SAMPLES STATISTICS: 1.980 nivelul anxietatii ina de terapie .3 297 . Error Mean Std.9500 N 20 20 Std. prezintă numărul de subiecţi din fiecare eşantion. conţine mediile celor două grupe analizate: Mini=107.1865 2 1 Mean Pair 1 nivelul anxietatii inainte de terapie nivelul anxietatii dupa terapie 107. N=20 4.ANALIZA COMPUTERIZATĂ A DATELOR Butonul OPTIONS este identic cu cel de la testul t care permite compararea unui eşantion cu o populaţie.270 7 10 9 8 Pair 1 Paired Samples Test 11 12 13 Paired Differences 95% Confidence Interval of the Difference Std. variabilele trebuie să fie perechi. Mfin=107. adică să provină de la aceeaşi subiecţi şi fie cuantificate cu aceeaşi unitate de măsură 2.1593 t -.2593 4.9.0166 5.025 df 19 Sig. După apăsarea butonului OK fereastra OUTPUT ne va prezenta următoarele rezultate: 3 Paired Samples Statistics 4 Std. . Error Mean 1. (2-tailed) .95 3.3062 5 6 Paired Samples Correlations N Pair 1 nivelul anxietatii inainte de terapie & nivelul anxietatii dupa terapie 20 Correlation -.

Corelaţia ne arată dacă subiecţii îşi schimbă ierarhia unii faţă de alţii. Avem trei situaţii posibile: • lipsa corelaţiei semnificative: în acest caz nu există o legătură între ierarhia subiecţilor la prima cu cea de al două măsurare. valoarea lui t. Subiecţii au acelaşi nivel al anxietăţii după intervenţia terapeutică. iar cei care aveau rezultate mari la prima măsurare au rezultate mari şi la a doua măsurare. astfel că putem spune că terapia nu a avut efect. nu numai nivelul variabilei dependente. cuprinde diferenţa medie dintre cele două grupe de subiecţi. cuprinde abaterea standard a eşantionului rezultat din diferenţele celor două eşantioane 11.25. conţine numele perechii de variabile şi precizează diferenţa dintre variabile. p=0.02 14. pragul de semnificaţie sau probabilitatea de eroare atunci când respingem ipoteza de nul: p=0.980. adică probabilitatea de eroare dacă am afirma că există o legătură între cele două variabile Tabelul PAIRED SAMPLES TESTS 8. conţine abaterile standard ale populaţiilor de eşantioane de N subiecţi din care provin eşantioanele noastre Tabelul PAIRED SAMPLES CORRELATIONS 6. Cei care aveau rezultate mici la prima măsurare au rezultate mici şi la a doua. pragul de semnificaţie al corelaţiei. În cazul nostru se constată că nu apare o diferenţă semnificativă între nivelul iniţial şi cel final al anxietăţii (dacă am respinge ipoteza de nul am greşi în 98% din cazuri sau cu alte cuvinte valoarea lui t se plasează în zona de încredere a ipotezei de nul). deoarece diferenţele nu sunt sistematice. • corelaţie pozitivă semnificativă: indică faptul că ierarhia subiecţilor se păstrează de la o măsurare la alta. Mfin=107.980 În continuare prezentăm rezultatele obţinute în urma analizei realizată anterior: Mediile iniţiale şi finale ale subiecţilor: Mini=107. adică nota t a eşantionului de diferenţe în cadrul populaţiei de eşantioane: t(19)=-0. • corelaţie negativă. în cazul nostru anx1-anx2 9. Valoarea negativă indică faptul că anxietatea iniţială este mai mică comparativ cu cea finală 10. ceea ce indică faptul că cele două variabile sunt independente una de cealaltă. r=-0.95 Valoarea lui t şi a pragului de semnificaţie: t(19)=-0. intervenţia acţionând oarecum haotic. semnificativă: indică faptul că ierarhia subiecţilor se inversează de la o măsurare la alta. Interpretarea se face în funcţie de valoarea lui t şi pragul de semnificaţie. gradele de libertate pentru care este calculată nota t. În exemplu nostru avem prima situaţie corelaţie nesemnificativă.270. Reamintim că pentru a respinge ipoteza de nul trebuie să avem cel mult 5% erori (p≤0. iar cei care aveau rezultate mari la prima măsurare au rezultate mici la a doua măsurare. coeficientul de corelaţie dintre cele două variabile pereche 7. df=19 15. Putem afirma că diferenţele între măsurători nu sunt sistematice.9. p=0.05). nu a îmbunătăţit starea subiecţilor. 298 . indică intervalul de încredere de 95%al diferenţei dintre mediile celor două grupe 13.LOREDANA GHERASIM 5. Cei care aveau rezultate mici la prima măsurare au rezultate mari la a doua.02. indică abaterea standard a populaţiei de eşantioane care cuprinde toate eşantioanele de aceeaşi mărime 12.

sav. În funcţie de variabila independentă se creează două grupe de subiecţi independenţi sau diferiţi (grupul 1 va fi format numai din subiecţii de gen masculin. Vom analiza dacă genul subiecţilor influenţează nivelul iniţial al anxietăţii pacienţilor.subiecţi de sex masculin şi 2 – subiecţi de gen feminin). Folosirea SPSS pentru compararea a două eşantioane independente Aplicarea testului t pentru eşantioane independente se face activând meniul ANALYZE – COMPARE MEANS. adică variabila asupra căreia dorim să analizăm influenţa variabilei independente. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE INDEPENDENTE Acest test se foloseşte când dorim să analizăm influenţa unei variabile independente.ANALIZA COMPUTERIZATĂ A DATELOR III. Ipoteza de cercetare: subiecţii de sex masculin vor avea un nivel al anxietăţii iniţiale diferit de cel al subiecţilor de gen feminin Ipoteza de nul: subiecţii de gen masculin şi feminin vor avea acelaşi nivel al anxietăţii iniţiale. 299 . câmpul în care vom introduce variabila dependentă.5. câmpul cu variabilele din baza de date 2. care presupune eşantioane independente de subiecţi. Fiecare subiect va putea face parte doar dintr-un singur grup. variabila dependentă fiind nivelul iniţial al anxietăţii. Pentru a demonstrat modul de utilizare a testului vom folosi datele din baza de date baza1. În acest caz variabila independentă este genul subiecţilor (cu două grade de intensitate. iar grupul 2 numai din subiecţi de gen feminin). 1 . opţiunea INDEPENDENT SAMPLES T TEST: Vom introduce variabila dependentă (nivelul anxietăţii înainte terapiei) în câmpul TEST VARIABLE şi variabila independentă în câmpul GROUPING VARIABLE: 1 2 3 4 Sunt trei câmpurile importante pe care trebuie să le avem în vedere: 1.

8.3 4.683 inainte de terap assumed Equal variance not assumed Sig.4747 -5.3636 6. 4. Error Sig. se pot preciza doar două dintre acestea. se observă că media grupului de subiecţi de gen feminin este mai mare: Mgr1=104. chiar dacă variabila independentă are mai multe grade de intensitate.8889 2.225 -2.LOREDANA GHERASIM 3.5712 .031 -5.4605 -10.5.9753 2. . celula indică variabila dependentă (nivelul anxietăţii înainte de terapie) care este analizată în funcţie de nivelurile variabilei independente (sexul subiecţilor) 2.1031 Independent Samples Test 6 7 Levene's Test for Equality of Variances t-test for Equality of Means Mean Std. câmpul unde introducem variabila independentă sau variabila de grupare (cea după care grupăm subiecţii).144 .019 t -2. Deviation 104.8571 110.4747 5% Confidence Interv of the Difference Lower Upper -.2711 -10. Activarea butonului DEFINE GROUPS deschide o fereastră unde vom trece valorile corespunzătoare celor două grupuri alese pentru comparaţie (în acest caz variabila independentă are doar două niveluri 1 şi 2): În fereastra OUTPUT sunt prezentate următoarele rezultate: 1 2 Group Statistics 3 4 5 sexul subiectilor nivelul anxietatii subiecti de gen masculin inainte de terapie subiecti de gen feminin N 9 11 Std.6442 2. Mgr2=110.5739 F nivelul anxietati Equal variance 6. Error Mean Mean Std. Sgr2=6.9 300 .3756 8 9 10 11 Vom prezenta succint semnificaţia datelor din tabele: 1. conţine media fiecărui grup independent. (2-tailed) Difference Difference 18 13. indică numărul de subiecţi din fiecare grup independent.039 .3053 -.411 df 2. conţine deviaţia standard pentru fiecare grup în parte: Sgr1=2. butonul care permite precizarea celor două niveluri ale variabilei independente. în cazul nostru avem 9 subiecţi de sex masculin şi 11 de gen feminin 3.

Pentru a respinge ipoteza de nul pragul de semnificaţie trebuie să fie cel mult egal cu 0.6.1% din cazuri şi s acceptăm ipoteza de cercetare.Mgr1=104. Greşim doar în 1. Levene.3575 F nivelul anxie Equal varian 1.3201 -8.9053 Independent Samples Test Levene's Test for quality of Variance t-test for Equality of Means 95% Confidence Interval of the Difference Mean Std.8.4545 Std. precizează cele două situaţii posibile în urma testării varianţei populaţiilor: varianţe egale (primul rând) sau varianţe inegale (al doilea rând) 7.2178 1.3 Testul Levene are valoarea F=6. Error ig. probabilitatea de eroare pentru respingerea ipotezei de nul în cazul testului Levene 9.497 17. p=0. apar diferenţe semnificative între nivelul anxietăţii iniţiale a subiecţilor de gen masculin şi feminin.031. Rezultatele obţinute sunt: Group Statistics Std. testează ipoteza de nul care afirmă că varianţele populaţiilor din care provin eşantioanele sunt egale 8.152 -3.3434 2. Testul. precizează deviaţia standard pentru populaţiile de eşantioane de N subiecţi din care provin grupele noastre 6.167 -3.1111 109.326 dupa terapieassumed Equal varian not assumed Sig.441 df 18 -1.3483 1. pentru că greşim doar în 3. Subiecţii de sex masculin au un nivel al anxietăţii semnificativ mai mic comparativ cu a celor de gen feminin. notat cu F.019. celula conţine valorile lui t pentru varianţe egale sau inegale ale populaţiilor. subiecţi de gen feminin . Deviation 4.5309 2.9% din cazuri dacă respingem ipoteza de nul. Interpretarea rezultatelor obţinute: Mediile: subiecţii de gen masculin . .4. Vom analiza efectul variabilei gen asupra nivelului anxietăţii subiecţilor după terapie. Putem respinge ipoteza de nul. Înainte de a analiza al doilea tabel. (2-tailed Difference Difference Lower Upper .0449 5. convenţia este ca să raportăm gradele de libertate de pe primul rând (în cazul nostru df=18) 11. vom extrage nota t şi semnificaţia de pe rândul EQUAL VARIANCES NOT ASSUMED. Valoarea lui t şi semnificaţia: t(18)=-2. ceea ce indică faptul că putem respinge ipoteza de nul (care afirmă că varianţele sunt egale). indiferent de rândul pe care îl citim. arată gradele de libertate pentru care a fost calculată semnificaţia notei t.265 t -1. p=0. Deci. Concluzia este că variantele celor două populaţii sunt diferite.3434 .ANALIZA COMPUTERIZATĂ A DATELOR 5.2334 -8. semnul lui t ne indică sensul diferenţei dintre medii. în funcţie de testul Levene. vom preciza faptul că testul LEVENE testează egalitatea varianţelor populaţiilor din care provin eşantioanele noastre.0444 1. Error Mean 1.545 301 . arată valoarea testului F.Mgr2=110. conţine pragul de semnificaţie sau probabilitatea de eroare care apare atunci când respingem ipoteza de nul şi acceptăm ipoteza de cercetare.05. fapt de care ne putem da seama uitându-ne la valorile mediilor 10.7805 sexul subiectilor nivelul anxietatii subiecti de gen masculin dupa terapie subiecti de gen feminin N 9 11 Mean 106.

Distanţa a reprezintă poziţia scorului x faţă de media grupului din care aparţine. Deci varianţele celor două populaţii sunt egale şi vom extrage rezultatele din primul rând. Pentru a distinge între grupuri ar trebui ca prima componentă a variaţiei să fie mai mică decât cea de a doua.167. Pentru a înţelege logica acestei metode să luăm un exemplu. Atunci când variaţia intragrup este mai mică decât variaţia intergrup înseamnă grupele sunt diferite. asupra variabilei dependente. mediu şi superior). M1.3. care are mai mult de două grade de intensitate (sau nivele). dar să aibă un salariu mai mare comparativ cu cei cu studii generale. t(18)=1. ANALIZA DE VARIANŢĂ . p=0. Variaţia totală a salariului populaţiei poate fi descompusă în două părţi: o parte din variaţie se datorează abaterilor fiecărui scor de la media grupului din care face parte (distanţa a). adică persoanele aflate în acelaşi grup să difere mai puţin între ele şi mai mult de subiecţii din celelalte grupe. 302 . iar linia curbă mai mare descrie distribuţia salariului pentru toate cele trei niveluri de studii luate la un loc. III.LOREDANA GHERASIM Mediile celor două grupe: Mgr1=106. Mgr2=109. p=0. iar cealaltă parte din variaţie este produsă de abaterile fiecărui scor de la media totală a populaţiei. iar distanţa b exprimă poziţia scorului x faţă de valoarea medie a populaţiei totale (formată din cele trei niveluri de studii la un loc). M2 şi M3 reprezintă salariul mediu pentru fiecare nivel de studii.4 Testul LEVENE (F=1.ANOVA UNIFACTORIAL Se foloseşte atunci când vrem să analizăm efectul unei variabile independente.7% din cazuri dacă am respinge ipoteza de nul şi am accepta ipoteza de cercetare).6. Să presupunem că suntem interesaţi dacă salariul românilor depinde de nivelul de studii (nivel general.256) este nesemnificativ (am greşi în 26.1. iar MG este salariul mediu total al tuturor salariaţilor. Reprezentarea grafică a situaţiei descrisă anterior este prezentată în imaginea de mai jos: a b x M1 M2 MG M3 Cele trei linii curbe mici descriu distribuţia salariilor pentru cele trei categorii de studii.44. Deci nu apar diferenţe semnificative între nivelul anxietăţii bărbaţilor şi femeilor după terapie.5% din cazuri dacă am respinge ipoteza de nul care afirmă ă varianţele sunt egale). Mai precis ne aşteptăm ca subiecţii cu studii medii să aibă un salar mai mic comparativ cu cei cu studii. Valoarea lui t este nesemnificativă (am greşi în 16.

Folosirea SPSS . 2-asiatică şi 3-africană) asupra indicelui de creştere al populaţie. calculează raportul între variaţia provocată de diferenţele întergrupuri. (formula de calcul este F=MSB/MSW) şi stabileşte dacă acest raport este suficient de mare pentru a putea distinge între grupe. indiferent de zona geografică. Semnificaţia coeficientului F se stabileşte în funcţie de două grade de libertate: gradele de libertate intergrup (valoare dată de numărul de grupuri minus 1) şi gradele de liberate intragrup (valoare dată de suma gradelor de libertate a grupurilor sau de numărul total de subiecţi mai puţin numărul grupurilor). coeficientul Fisher). Ipoteza de cercetare: variabila regiune influenţează valoarea densităţii populaţie sau indicele de creştere va varia în funcţie de regiune. Ipoteza de nul: indicele de creştere (densitatea) va avea aceeaşi valoare. câmpul în care sunt introduse variabilele dependente (în cazul nostru densitatea). 3. este câmpul în care se introduce variabila independentă sau factor (în exemplul nostru factorul este regiunea).ANALIZA COMPUTERIZATĂ A DATELOR Analiza de varianţă (simbolul este F. MSW. şi variaţia cauzată de diferenţele intragrup. opţiunea ONE WAY ANOVA: Vom introduce variabila dependentă (procentul de creştere al populaţie) în câmpul DEPENDENT LIST şi variabila independentă în câmpul FACTOR: 2 1 3 4 6 5 Să analizăm fereastra: 1. MSB.sav şi vom analiza efectul variabilei regiune (care are trei grade de intensitate: 1-europeană. Pentru realizarea acestei analize se deschide meniul ANALYZE – COMPARE MEANS. câmpul în care sunt afişate variabilele din baza de date.ANOVA unifactorial Vom folosi baza de date Baza7. 2. 303 .

Testele sunt prezentate în ordinea descrescătoare a puterii lor. Activarea butonului descriptiv deschide următoarea casetă: Opţiunile pe care le vom bifa sunt DESCRIPTIV pentru a vedea mediile celor trei grupe şi reprezentarea grafică a efectului MEANS PLOT. butonul CONTRAST permite realizarea unor comparaţii între grupe în funcţie de variabila independentă.564 1.433 1. 5.376 . După activarea butonului OK al ferestrei principale în foia cu rezultate apr următoarele tabele: Descriptives procentul de crestere anuala a populatiei N europa asia africa Total 15 11 11 37 Mean . 6.149 304 . Pentru a analiza efectul variabilei independente asupra celei dependente se foloseşte testul BONFERRONI.LOREDANA GHERASIM 4.693 1. Pragurile de semnificaţie a acestor teste sunt ajustate în funcţie de numărul de grupe. butonul POST HOC permite alegerea unui anumit tip de contrast post-hoc.724 2. butonul OPTIONS conţine elemente de statistică descriptivă.489 Std.956 . Vom descrie pe scurt opţiunile butonului POST-HOC: Toate testele de la această opţiune indică dacă diferenţele obţinute pe ansamblu prin analiza testului F se regăsesc şi la nivelul comparaţiilor dintre grupuri luate două câte două. Deviation .

257 asia europa 1. în a doua coloană sunt trecute deviaţiile pătratice care intră în componenţa fiecărui tip de varianţă (intergrup şi intragrup).000 -1.642 .303 47.259* . Putem spune că doar pe ansamblu se întâmplă acest lucru pentru că rezultatele analizei ANOVA se referă doar la existenţa diferenţelor globale dintre grupe. putem concluziona că pe ansamblu. 8.969* .257 africa -.5).000 Between Groups Within Groups Total 3 4 Multiple Comparisons 5 6 Dependent Variable: procentul de crestere anuala a populatiei Bonferroni 7 8 9 11 95% Confidence Interval Sig.666 -.257 africa -2.277 africa europa 2. Coloana este notată cu I.642 1.259* . 4.004 . 305 .257 asia . .564 ANOVA procentul de crestere anuala a populatiei df 2 34 36 Mean Square 16. F(2.939 . Lower Bound Upper Bound .273 1.000 . Pentru a vedea diferenţele dintre grupuri trebuie să analizăm rezultatele prezentate în tabelul POST HOC TESTS: 7.421 F 39. The mean difference is significant at the .000 1. prima coloană indică nivelul de referinţă al variabilei independente.5.273 .000 -2. Din datele pe care le avem până acum.277 *.05 level.532 Sig.261 14. gradul de libertate intergrup (sau between) este 2 (3 grupe-1). în prima coloană sunt trecute cele două componente ale variaţiei totale: cea intergrup şi intragrup. p<0.666 10 Mean Difference (I) regiunea geografic (J) regiunea geografic (I-J) Std. coloana afişează valorile diferenţelor dintre coloana I şi J. în această coloană sunt prezentate gradele de libertate pentru care se calculează valoarea prag a lui F.290* . fără a preciza care sunt grupele între care apar diferenţe semnificative. Coloana este notată cu J.611 2. 3.4=39.34)=39. conţine valoarea testului F obţinută prin împărţirea mediei varianţei intragrup la media varianţei intergrup (în exemplul nostru: 16. Vom prezenta succint semnificaţia datelor din tabele: 1. conţine semnificaţia testului F sau probabilitatea de eroare când respingem ipoteza de nul. 5.004 -1. 6.908 -1.ANALIZA COMPUTERIZATĂ A DATELOR 1 2 Sum of Squares 33.6/0.001. regiunea influenţează valoarea indicelui demografic. coloana a doua indică nivele variabilei independente care sunt comparate cu nivelurile de referinţă.630 .969* .611 .939 -. Error europa asia -1.290* .908 . 2. faţă de care se face comparaţia. în această coloană sunt prezentate componente ale testului F. 9. iar cel intragrup este 34 (numărul total de subiecţi este 37 minus 3 numărul de grupe).

steluţa care apare în dreptul diferenţelor dintre medii indică existenţa unor diferenţe semnificative între acestea. p<0.2. 11. dar mai mici decât cel al regiunii africane).057 F 2.072 Sig. în exemplul nostru observăm următoarele rezultate: Mgr1(Europa)-Mgr2(Asia)=-1. coloana conţine valoarea exactă a pragului de semnificaţie pentru fiecare diferenţă. Astfel. cea mai mare valoarea a indicelui demografic îl are regiunea africană (indicele este semnificativ mai mare comparativ cu celelalte două regiuni).638 756166.LOREDANA GHERASIM 10. În imaginea de mai jos apare grafică a efectului: În continuare vom analiza efectul variabilei regiune asupra densităţii.001 Mgr1(Europa)-Mgr3(Africa)=-2.2.96. Pe ultimul loc se plasează Europa cu cel mai mic (semnificativ mai mic comparativ cu zona asiatică şi africană) indice demografic. urmează apoi regiunea asiatică (indicele este semnificativ mai mare decât cel al regiunii europene. . Rezultatele obţinute sunt următoarele: ANOVA Numar de oameni/ kilometru patrat Sum of Squares 3133461 25709646 28843107 df 2 34 36 Mean Square 1566730. p<0.142 Between Groups Within Groups Total 306 .004 Între toate grupele apa diferenţe semnificative. p=0.001 Mgr2(Asia)-Mgr3(Africa)=-0.

6. 2 307 . 8. 2.447 21. 1. 2. 8. Pentru a analiza efectelor mai multor variabile independente se poate folosi analiza de varianţă factorială. 2.000 . 2. 8.1. 2. 2. 8. 10. 2. 1. p=0.ANALIZA COMPUTERIZATĂ A DATELOR Multiple Comparisons Dependent Variable: Numar de oameni/ kilometru patrat Bonferroni Mean Difference (I-J) -627. 1. 2. Error 345. 1.nivel scăzut al stimei de sine şi 2 – nivel ridicat al stimei de sine). 7. la fel coeficientul F măsoară raportul dintre variaţia cauzată de împărţirea pe grupuri şi variaţia intrinsecă a grupurilor. Acest tip de analiză prezintă două tipuri de note F corespunzătoare celor două tipuri de efecte pe care le măsoară. 2.172 627. 6. III. .142.7.GENERAL LINEAR MODEL . 1. 2. Prezentăm mai jos datele care trebuie introduse în programul SPSS: Nota: 9.186 345. Metodele prezentate până acum (testele t şi ANOVA unifactorial) permit doar evidenţierea influenţei separate a fiecărui factor. niv_stim (nivelul stimei de sine.268 1.234 1. 6. 2. 2.186 370. 8. Logica acestei metode este identică cu a modelului ANOVA unifactorial. Efectele principale măsoară influenţa unei variabile independente asupra variabilei dependente. 6. 1. 1. 7. 5. 2. 2. 7.UNIVARIATE Pentru a prezenta modul de folosire al programului SPSS pentru aplicarea acestei metode vom crea o nouă bază de date (baza8. 1.34)=2. 2. 10. 2. 8. 7. 1. 1.nivel scăzut de anxietate scăzut şi 2 nivel ridicat de anxietate). 2.sav) care conţine trei variabile: nota (notele obţinute de studenţi la examen). 2. Deci. 8 Niv_stim: 1. Efectele de interacţiune măsoară influenţa combinată a două sau mai multor variabile independente asupra variabilei dependente. 10. 2. niv_anx (nivelul de anxietate cu două valori: 1 . indiferent de acţiunea celorlalte variabile independente. 2. 1. 1. 9. 5.789 Sig. 7. 1.2% din cazuri). 1.618 -21. 9. 1. 2. 2. densitatea populaţiei este aproximativ aceeaşi indiferent de regiune: europeană. 2. 2. 1. asiatică sau africană. 1. cu două valori: 1 . 1.447 648. 2 Niv_anx: 1. ANOVA UNIVARIATE Cele mai multe studii realizate în domeniul psihologiei studiază efectul mai multor factori (variabile independente) asupra uneia sau mai multor variabile dependente. 2. Constăm nu există un efect al variabilei regiune asupra densităţii populaţiei (nu putem respinge ipoteza de nul pentru că am greşi în 14. 2. 2. 1. 5.000 . 1. 8.268 Din tabelul ANOVA extragem valoarea şi semnificaţia lui F: F(2. 1. 1.186 345. 5. Testul POST HOC Bonferroni nu semnalează diferenţe semnificative între cele trei grupe care se formează în funcţie de intensităţile variabilei independente. 7. Folosirea SPSS .234 .172 -648.07. 1. 7. 1. 1. 6. 9.186 370. 1. 1. 1.618 (I) regiunea geografica europa asia africa (J) regiunea geografica asia africa europa africa europa asia Std.789 345. 1.

astfel vom vedea dacă variabilele noastre independente (trecute în câmpul FIXED FACTORS) influenţează variabila dependentă indiferent de acţiunea factorilor covarianţi. Pentru exemplul nostru. în câmpul COVARIATE pot fi trecute variabile independente sau variabile dependente care ar putea avea o legătură sau un efect asupra variabilei dependente. conţine variabilele din baza de date 2. se poate introduce o singură variabilă dependentă 3. Variabila dependentă este NOTA (vom trece această variabilă în câmpul DEPENDENT VARIABLE: 308 . în câmpul FIXED RACTOR se introduc variabilele independente (sau factorii) a căror efect este controlat (nu este cauzat de întâmplare) 4. deci vom trece aceste variabile în câmpul FIXED FACTORS. Pentru analiza efectului combinat voma activa meniul ANALYZE . în câmpul RANDOM FACTOR pot si trecute variabilele independente. în câmpul DEPENDENT VARIABLE se introduce variabila dependentă. este o opţiune pentru utilizatorii avansaţi şi nu recomandăm folosirea metodei fără cunoaşterea precisă a semnificaţiei sale. Variabila dependentă este nota obţinută la examen.LOREDANA GHERASIM În acest exemplu avem două variabile independente niv_stim (nivelul stimei de sine) şi niv_anx (nivelul de anxietate).GENERAL LINEAR MODEL opţiunea UNIVARIATE. aici se trec valorile pe care le putem folosi atunci când bănuim că unele variabile independente (factori) ar corela între ele. variabilele independente sunt nivelul stimei de sine (NIV_STIM) şi nivelul anxietăţii (NIV_ANX). Odată activată comanda pe ecran apare următoarea fereastră: 2 3 1 4 5 6 Vom explica această fereastră: 1. care nu ne interesează în mod direct sau a căror acţiune nu o putem controla 5. Vom analiza efectul de interacţiune (sau combinat) al nivelului de anxietate şi al stimei de sine asupra notei obţinute la examen. fiecare din ele având două grade de intensitate. 6.

309 . bifarea acestei opţiune activează automat câmpurile şi butoanele care se găsesc dedesubt. Precizăm nu vom folosi în analiză toate opţiunile. Pentru modelele simple se recomandată utilizarea acestei opţiuni 2. ceea ce înseamnă că se vor lua în calcul toate efectele principale şi combinaţiile posibile de factori. opţiunea CUSTOM se foloseşte dacă se doreşte simplificarea modelul cu care se lucrează. opţiunea FULL FACTORIAL este marcată implicit. Butonul MODEL activează următoarea fereastră: 2 1 3 4 Opţiunile din această fereastră folosesc la construirea unor modele de analiză în condiţiile în care situaţia investigată este complicată (conţine multe variabile independente).ANALIZA COMPUTERIZATĂ A DATELOR În partea dreaptă fereastra principală există o serie de butoane care conţin opţiuni complexe de analiză. permiţând calculul anumitor efecte pentru anumiţi factori 3. acestea putând fi folosite pentru design-uri experimentale mult mai complexe. Să analizăm fereastra: 1. folosind opţiunile care se deschid din câmpul INTERACTION. cu ajutorul butonului cu săgeată se pot selecta factorii pentru care dorim să se calculeze efectele. putem alege efectele pe care vrem să le analizăm.

Apoi. vom păstra opţiunea marcată implicită FULL FACTORIAL. Pentru exemplificare. Se recomandă tipul de contrast DIFFERENCE. Se apasă butonul CONTINUE pentru a reveni la fereastra principală.LOREDANA GHERASIM 4. Pentru exemplul nostru. După alegerea tipului de contrast trebuie activat butonul CHANGE. se cere programului să analizeze dacă între cele două nivele ale variabilei nivel al stimei de sine vor apărea diferenţe în ceea ce priveşte notele obţinute. 310 . Cu alte cuvinte vom vedea dacă cei cu stimă de sine ridicată obţin note diferite de cei cu stimă de sine scăzută). La fel se procedează şi pentru variabila independentă nivelul anxietăţii. Prin tipul de contrast DIFFERENCE. permite alegerea tipului de interacţiune dintre variabilele independente (cât de complexă să fie interacţiunea) şi calculul unor coeficienţi de regresie ai modelului (există o legătură strânsă între Regresia liniară şi analiza de varianţă). Aici sunt trecute doar variabilele independente. am ales variabila NIV_STIM (nivelul stimei de sine). Se alege variabila independentă pentru care se doreşte calculul contrastul (diferenţa dintre nivelele sale de variaţie). se alege tipul de contrast din câmpul CONTRAST. Butonul CONTRAST deschide următoarea fereastră: Opţiunile acestei ferestre permit compararea diferitelor grupuri rezultate din împărţirea subiecţilor în funcţie de valorile sau categoriile variabilelor independente.

ca în imaginea de mai jos: 311 . Pe axa SEPARATE LINES se introduce variabila pentru care se vor trasa linii ce vor reprezenta categorii diferite ale factorului. care indică relaţia dintre variabilele introduse anterior pentru fiecare nivel al factorului trei. ceea ce permite obţinerea mai multor grafice. SEPARATE PLOTS se foloseşte introducerea celui de al treilea factor. În consecinţă vom reprezenta notele la examen în funcţie de nivelul stimei de sine.ANALIZA COMPUTERIZATĂ A DATELOR Butonul PLOTS activează o fereastră dedicată reprezentărilor grafice: Pe axa HORIZONTAL AXIS se introduce variabila independentă ale cărei categorii dorim să le reprezentăm pe axa X. NIV_STIM (pe care o vom trece pe axa X) şi nivelul anxietăţii. NIV_ANX (reprezentată prin linii separate). În exemplul nostru avem doar doi factori.

Pentru exemplul nostru nu avem nevoie de comparaţii POST HOC.LOREDANA GHERASIM Se activează butonul ADD. Pentru a analiza diferenţele dintre grupe se foloseşte testul Bonferroni. deoarece ambele variabile independente au doar două nivel. Nu vom mai comenta aceste opţiuni. Revenim din nou în fereastra principală pentru a activa butonul POST HOC care va deschide fereastra: Acest buton are opţiuni similare cu butonul POST HOC din fereastra ANOVA ONE-WAY. Vom reveni la fereastra principală fără a activa vreo opţiune. dar menţionăm că ele facilitează tratarea analizei de variantă ca un model particular de regresie. deoarece în urma activării acestuia câmpurile ferestrei se golesc. Acest buton permite realizarea mai multor grafice. Butonul SAVE activează următoarea fereastră: Opţiunile la care face referire acest buton se referă la o altă metodă statistică numită Regresia liniară. Butonul OPTIONS activează o fereastră specifică acestei analize de varianţă: 312 . Recomandăm folosirea acestor opţiuni doar celor care cunosc regresia. Această opţiune se foloseşte doar când variabile independente au mai mult de două nivele de variaţie.

De exemplu. precum şi testele de omogenitate (care trebuie să nu fie semnificative pentru a putea aplica acest model ANOVA). prezintă toate combinaţiile de factori pentru care avem grupuri diferite de subiecţi. sunt 16 subiecţi în grupul celor cu nivel scăzut al stimei de sine. Primele elemente ale output-ului se referă la parametrii descriptivi ai modelului. minimul şi maximul). ne interesează calculul parametrilor descriptivi (media.ANALIZA COMPUTERIZATĂ A DATELOR 2 1 3 Prezentăm elementele principale ale ferestrei: 1. permiţând calcularea mediei pentru fiecare grup de subiecţi în parte. 313 . este câmpul în care se trec factorii pentru care dorim să calculăm mediile grupurilor de subiecţi 3. deviaţia standard. Dintre toate. Primul tabel precizează numărul de subiecţi pentru fiecare grup obţinut în funcţie de nivelurile fiecărei variabile independente. Opţiunea OVERALL se referă la media calculată pentru toţi subiecţii. neîmpărţiţi în grupuri 2. prezintă opţiuni ce permit calcularea mai multor parametri. După selecţia opţiunilor fereastră arată astfel: În continuare vom prezenta foaia cu rezultate.

LOREDANA GHERASIM

Al doilea tabel precizează mediile totale precum şi cele corespunzătoare fiecărui subgrup de subiecţi, subgrup determinat de categoriile factorilor din model. Aceste date sunt rezultatul opţiunilor marcate de noi din fereastra butonului OPTIONS.

Mai departe, în foaia de rezultate sunt prezentate elementele cele mai importante ale outputului, rezultatele testului F.

Tabelul cu testul lui Levene reprezintă tocmai testul de omogenitate, care trebuie să fie nesemnificativ pentru a utiliza această metodă.
4 2 3

1

Cele mai importante elemente ale tabelului se referă la testul F. Ne interesează numai liniile marcate prin acolade. 1. arată variabilele ale căror efecte le luăm în calcul:

314

ANALIZA COMPUTERIZATĂ A DATELOR

linia cu NIV_STIM arată efectul principal al factorului nivelul stimei de sine, indiferent de acţiunea celuilalt factor; • NIV_ANX arată efectul principal al factorului nivel de anxietate, indiferent de acţiunea celuilalt factor; • linia NIV_STIM*NIV_ANX se referă la efectul de interacţiune al celor două variabile asupra variabilei dependente; 2. conţine notele F corespunzătoare efectelor principale şi de interacţiune; 3. conţine pragurile de semnificaţie ale testelor F. 4. conţine gradele de libertate between subjects şi within subjects Pentru exemplu nostru s-a obţinut doar un singur F semnificativ (p<0,05) şi anume cel corespunzător liniei NIV_STIM (F(1,30)=22,13, p<0,001). Deci apare un efect principal al variabilei nivelul stimei de sine asupra notelor la examen. Restul efectelor sunt nesemnificative. Nu apare un efect principal al variabilei nivelul anxietăţii (F(1,30)=2,7, p=0,107), deci notele subiecţilor nu depinde de cât de anxioşi sunt aceştia. De asemenea, nu apare un efect de interacţiune al variabilelor independente nivelul stimei de sine şi nivelul anxietăţii (F(1,30)=0,02, p=0,881), deci nota la examen nu este influenţată de efectul combinat al nivelului de anxietate şi al stimei de sine. Pentru a vedea modul în care nivelul stimei de sine (NIV_STIM) influenţează nota la examen, trebuie să ne uităm în tabelul de contrast: Testul de contrast calculează diferenţa între media notelor obţinute de subiecţii cu nivel ridicat al stimei de sine şi a celor cu nivel scăzut al stimei de sine (LEVEL 2 vs. LEVEL l). Această diferenţă a fost comparată cu situaţia în care cele două grupuri ar fi obţinut valoarea zero (HYPOTHESIZED VALUE). Pragul de semnificaţie (notat cu SIG) indică apariţia unei diferenţe semnificative. Sensul diferenţei (-1,93) indică faptul că cei cu nivel ridicat al stimei de sine (LEVEL 2) au obţinut note mai semnificativ mai mici comparativ cu cei cu nivel ridicat al stimei de sine (LEVEL 1). Tabelul alăturat reia analiza contrastelor pentru factorul nivelul anxietăţii: Aici nu mai apar diferenţe semnificative (fapt confirmat şi de lipsa unui efect principal pentru această variabilă), deci nivelul anxietăţii nu afectează nota la examen (Mdif=-0,68, p=0,107). Următoarele tabelele prezintă media obţinută pe ansamblu (tabelul l), mediile obţinute pentru fiecare factor în parte (tabelele 2 şi 3) şi cele pentru grupurile de subiecţi rezultat al combinării nivelurilor celor două variabile independente. Aceste tabele ajută la interpretarea sensului diferenţelor la testele de
315

LOREDANA GHERASIM

contrast şi interacţiunii variabilelor. Tabelele prezintă şi deviaţiile standard şi limitele valorii medii pentru un interval de încredere de 95%.

La finalul foii de rezultate apare reprezentarea grafică a interacţiunii dintre variabilele independente:

Liniile graficului reprezintă nivelurile diferite de anxietate. Efectul principal al variabilei NIV_STIM poate fi observat grafic cu uşurinţă: notele obţinute de subiecţii cu stimă de sine ridicată au valoare mai mică comparativ cu cei care au stimă de sine scăzută. Putem concluziona, pentru exemplul nostru, că nota la examen este influenţată de nivelul stimei de sine dar nu şi de nivelul anxietăţii. Mai mult, nivelul stimei de sine acţionează asupra notei la examen în acelaşi mod indiferent de nivelul anxietăţii.

316

Atunci când una dintre variabilele independente presupune eşantioane perechi sau măsurări repetate. Activarea comenzilor pentru acest model ANOVA se face din meniul ANALYZE . 109. cu două valori care corespund celor două tipuri de intervenţii terapeutice 1. ANX2: 110. 2. iar cealaltă măsurări repetate. 109. 103. 117. 112. 103. 110. Scopul cercetării ar putea fi analiza eficienţei intervenţiilor terapeutice asupra nivelului anxietăţii. 2. 124. pe ecran apare fereastra alăturată: Pentru a putea face analiza trebuie definită variabila care presupune măsurări repetate. 104. şi TERAPIE (tipul de terapie utilizat. 104. 102. 110. trebuie să utilizăm un alt model de analiză de varianţă. 102. 2.sav) care conţine trei variabile: ANX1 (scorurile pacienţilor la scala de anxietate înaintea terapiei. se formează o nouă variabilă independentă. Folosirea SPSS . 104. 110. Cu alte cuvinte trebuie denumită variabila independentă care presupune măsurări repetate şi trebuie precizate nivelurile acesteia. 2. 2.tip 2 terapie). 106. ANX2 (scorurile pacienţilor la scala de anxietate după terapie). Variabila independentă tip de terapie (TERAPIE) are două nivele (tip 1 de terapie şi tip 2 terapie) şi presupune eşantioane independente. 104. 102. 2. Astfel. 1. în cazul nostru această variabilă este măsurarea repetată a anxietăţii înainte şi după terapie (sau test-retest). care apare în câmpul WITHIN-SUBJECTS FACTOR NAME (factor 1) vom trece numele noii variabile 317 . pe care o vom denumit TRT. 106. La fel ca şi modelul de varianţă prezentat anterior şi acest tip de analiză prezintă două tipuri de note F corespunzătoare tipurilor de efect măsurate. 2. 104. una presupunând eşantioane independente. 1 – pretest (înainte terapiei) şi 2 posttest (după terapie). 102. 1. indiferent de acţiunea altei variabile independente. 108. 105. 110. 112. şi anume modelul ANOVA cu măsurări repetate. 2. ANOVA REPETED MEASURES Modelul ANOVA UNIVARIATE prezentat anterior permite analiza efectului de interacţiune a două variabile independente care presupun grupe independente de subiecţi. Efectele de interacţiune măsoară influenţa combinată a două sau mai multor variabile independente asupra variabilei dependente. 116. Prezentăm mai jos datele. 2. 115. 103. 105. 115. 2. Pentru a analiza efectul terapiei asupra stării pacienţilor trebuie să comparăm nivelul iniţial şi cel final al anxietăţii pacienţilor. 2 Variabila dependentă este reprezentat de scorurile obţinute la scala de măsurare a anxietăţii înainte şi după terapie. 1. În locul denumirii generice a variabilei care presupune măsurări repetate. 1. După activarea comenzii. Acest model de analiză de varianţă se utilizează atunci când se doreşte analiza efectului de interacţiune a două variabile independente. care trebuie introduse în programul SPSS: ANX1: 109. 121. 1. 115. 102. 110.GENERAL LINEAR MODEL opţiunea REPETED MEASURES. 102. cu măsurări repetate. 105.tip 1 de terapie şi 2 . 1. TERAPIE: 1.ANALIZA COMPUTERIZATĂ A DATELOR III. Această variabilă independente se referă la momentul măsurării anxietăţii pacienţilor şi are două niveluri. 1. Efectele principale măsoară influenţa fiecărei variabile independente asupra variabilei dependente. 103.GENERAL LINEAR MODEL – REPETED MEASURES Pentru a prezenta modul de utilizare a programului SPSS pentru aplicarea acestei metode vom crea o nouă bază de date (baza 8.8. 1. 104.

pentru a putea utiliza metoda şi defini variabilele independente (vezi imaginea din stânga): După salvarea definirii factorului cu măsurări repetate se activează butonul DEFINE.LOREDANA GHERASIM TRT. În câmpul NUMBER OF LEVEL trebuie trecut numărul de măsurători repetate. în consecinţă aceste variabile se introduc în câmpul WITHIN-SUBJECTS VARIABLES (TRT). 318 . În cazul nostru variabilele ANX1 şi ANX2 reprezintă nivelurile variabilei TRT. se introduc variabile independente sau dependente care ar putea avea legătură sau ar influenţa variabila dependentă. care activat deschide o nouă fereastră: 2 1 3 4 Vom prezenta câmpurile acestei ferestre: 1. această variabilă presupunând grupe independente de subiecţi şi reprezentând variabila factor. aici se introduc variabilele care reprezintă niveluri ale variabilei independente cu măsurări repetate. 4. 2. Pentru exemplul nostru vom trece valoarea 2 pentru că anxietatea este măsurată înainte şi după terapie (vezi imaginea din dreapta): Se activează butonul ADD. Variabila tip de terapie (TERAPIE) se introduce în câmpul BETWEEN-SUBJECTS FACTOR. este câmpul ce conţine variabilele din baza de date. 3. în acest câmp introducem variabilele independente care presupun eşantioane independente.

ANALIZA COMPUTERIZATĂ A DATELOR În partea de jos a ferestrei principale apar o serie de butoane care conţin opţiuni complexe de analiză. Butonul MODEL activează următoarea fereastră: Opţiunile din această fereastră folosesc la construirea unor modele în condiţiile în care situaţia investigată este prea complicată. vom păstra opţiunea selectată implicit FULL FACTORIAL. Pentru exemplul nostru. Butonul CONTRAST activează următoarea casetă de dialog: 319 . ceea ce va însemna că în foia cu rezultate vor apărea atât efectele principale ale celor două variabile independente cât şi efectul de interacţiune al acestora. Opţiunile sunt similare celor care au apărut în modelul de analiză de varianţă prezentat anterior ANOVA UNIVARIATE.

Opţiunea se foloseşte atunci când variabile independente au mai mult de două nivele de variaţie. În consecinţă. care presupune două niveluri. Butonul PLOTS activează o fereastră dedicată reprezentărilor grafice. Vom reprezenta nivelul anxietăţii pacienţilor în funcţie de tipul terapiei (pe care o vom trece pe axa X) şi momentul evaluării anxietăţii TRT (reprezentată prin linii separate): Se activează apoi butonul ADD pentru ca aplicaţia SPSS să reţină reprezentarea grafică a interacţiunii dintre variabilele independente: Butonul POST HOC deschide următoarea fereastră: Acest buton are opţiuni similare butonului POST HOC din fereastra ANOVA ONE-WAY şi UNIVARIATE. De asemenea. Pentru exemplul nostru nu avem nevoie de comparaţii POST-HOC. vom reveni la fereastra principală fără a activa vreo opţiune. pentru a analiza diferenţele dintre grupe se foloseşte testul Bonferroni. pentru că variabilele independente au dor două niveluri.LOREDANA GHERASIM Se observă că deja este selectat tipul de contrast pentru variabila independentă care presupune măsurări repetate (TRT Polynomial). 320 . Trebuie să alegem tipul de contrast pentru variabila TERAPIE. Vom selecta tipul de contrast Difference.

Primele elemente ale output-ului se referă la parametrii descriptivi ai modelului. butonul se referă la o altă metodă statistică numită Regresia liniară. deci pentru fiecare grup experimental. Primul tabel precizează nivelurile (ANX1 şi ANX2) variabilei cu măsurări repetate (TRT). precum şi în funcţie ambele variabile. În continuare vom prezenta foaia cu rezultate. Al doilea tabel precizează numărul de subiecţi pentru fiecare grup obţinut în funcţie de nivelurile factorului care presupune eşantioane independente: Următorul tabel precizează mediile pentru fiecare subgrup de subiecţi format în funcţie de toate categoriile factorilor din model.ANALIZA COMPUTERIZATĂ A DATELOR Butonul SAVE activează următoarea fereastră: La fel ca la ANOVA UNIVARIATE. Butonul OPTIONS activează o fereastră specifică analizei de variantă: La OPTIONS avem posibilitatea de a cere calculatorului să ne afişeze mediile grupelor de subiecţi în funcţie de fiecare variabilă independentă. 321 . facilitând tratarea analizei de variantă ca un model particular de regresie. Recomandăm folosirea acestor opţiuni doar celor care cunosc regresia.

nu apare un efect combinat al variabilelor independente. Următorul tabel indică efectul variabilei independente tip de terapie.267. Pentru a vedea cum influenţează tipul de terapie nivelul anxietăţii pacienţilor vom analiza tabelul Custom Hypothesis. De asemenea.18)=0. p=0.940).23.002).050). 322 .661). p=0. pacienţii care au primit tipul 2 de terapie au un nivel al anxietăţii semnificativ mai ridicat comparativ cu pacienţii care au primit terapia de tip 1 (Mdif=4.LOREDANA GHERASIM Următoarele două tabele prezintă efectele principale şi de interacţiune ale variabilelor independente.18)=13.40. fără a ţine seama de momentul măsurării F(1.18)=0. p=0. ceea ce indică faptul că nivelului iniţial al anxietăţii pacienţilor nu diferă de nivelul final al anxietăţii pacienţilor după terapie (F(1. Astfel. indiferent de tipul de terapie utilizat. Se constată că apare un efect principal al acestei variabilei independente asupra nivelului anxietăţii pacienţilor după terapie. Faptul că subiecţii au acelaşi nivel al anxietăţii după intervenţia terapeutică indică faptul că terapia utilizată nu a avut efect.006. Deci subiecţii au acelaşi nivel al anxietăţii înainte şi după terapie. TRT*TERAPIE (F(1. La fel ca şi la modelul de analiză de varianţă anterior se extrag valorile coeficienţilor F. p=0. În primul tabel se constată că nu apare un efect al variabilei TRT (p>0.002. pragul de semnificaţie şi gradele de libertate.

mediile obţinute pentru fiecare factor în parte (tabelele 2 şi 3) şi pentru grupele de subiecţi obţinute în urma combinării nivelurilor celor două variabile independente (tabelul 4). Efectul principal al variabilei TERAPIE poate fi observat grafic cu uşurinţă. La finalul foii de rezultate apare reprezentarea grafică a interacţiunii dintre variabilele independente: Liniile graficului reprezintă momentele măsurării anxietăţii. Aceste tabele ajută la interpretarea sensului diferenţelor la testele de contrast şi interacţiunii variabilelor. Tabelele prezintă şi deviaţiile standard şi limitele valorii medii pentru un interval de încredere de 95%. 323 .ANALIZA COMPUTERIZATĂ A DATELOR Următoarele tabelele prezintă media obţinută pe ansamblu (tabelul l).

prin raportare la o distribuţie teoretică stabilită de cercetător.deloc mulţumit. 4-mult. Folosirea SPSS Pentru a demonstrat modul de aplicare a acestei metode vom crea o nouă bază de date (baza9. cu două valori: 1 . datele pe care le obţinem folosind aceste scale de măsură nu mai pot fi analizate folosind metodele prezentate anterior.sav) care cuprinde următoarele variabile: VRST (vârsta subiecţilor). În acest fel. cu două valori: 1 indicând persoanele care au votat pe Geoană. De exemplu. Totuşi. În consecinţă. TESTUL CHI PĂTRAT Testul chi-pătrat permite compararea distribuţiei frecvenţelor unei variabile pe mai multe categorii.foarte mulţumit). Din acest motiv. 3-mediu. cu două valori: 1 semnifică subiecţi de gen masculin şi 2 subiecţi de gen feminin) şi VOT (cuprinde răspunsurile subiecţilor la întrebarea „Cu cine aţi votat la ultimele alegeri prezidenţiale?.puţin mulţumit şi 3 . 2-puţin. recomandăm conceperea instrumentelor utilizând scalele de interval în locul celor nominale sau ordinale. Metodele statistice utilizate pentru analiza acestor date sunt numite teste neparametrice. precum media sau abaterea standard. Vom prezenta câteva dintre metodele neparametrice. Deoarece avem de a face cu scale nominale sau ordinale. Prezentăm scorurile subiecţilor la cele patru variabile: 324 . parametrii obişnuiţi pe care i-am folosit până acum în analiză. 5-foarte mult". nu mai pot fi utilizaţi. IV. 2 . pot fi uşor detectate diferenţele folosind metodele parametrice. Aceste date se analizează pornind de la frecvenţele de apariţie ale diferitelor categorii sau de la probabilităţile de apariţie ale acestor categorii. iar 2 indicând pe cei care au votat Băsescu) şi variabila GR_MULT (conţine răspunsurile subiecţilor la întrebarea „Cât de mulţumiţi sunteţi de situaţia actuală a ţării?”. aceste metode pot eşua mai uşor în demonstrarea diferenţele.LOREDANA GHERASIM IV. în locul măsurării preferinţei pentru un anume tip de muzică folosind o scală ordinală de tipul „1-deloc.1. este mai indicată măsurarea pe o scală de interval de tipul „1-deloc -2-3-4-5 . DATELE NEPARAMETRICE Datele non-parametrice sunt mai frecvent utilizate în sociologie decât în psihologie. Testul compară abaterile de la această distribuţie teoretică obţinute în realitate şi estimează probabilitatea ca ele să apară aleatoriu. deoarece nu există restricţii cu privire la distribuirea normală a rezultatelor.foarte mult". GEN (genul subiecţilor. fără a intra în detaliile teoretice privind aceste teste. acolo unde acestea există în realitate. Aplicarea acestor teste este mai facilă decât folosirea testelor parametrice.

32. 2. 2. 62. 3.ANALIZA COMPUTERIZATĂ A DATELOR VRST: 45. Dacă însă doream să comparăm distribuţia cu o alta. 2. 1 În exemplul nostru. 1. 3. Rezultatele testului apar în foaia cu rezultate sub forma a două tabele: În primul tabel sunt trecute elementele descriptive ale testului. Vom activa fereastra specifică testului din meniul ANALYZE . 2. 36. 1. 1. 47. 2. 1. 3. 2. 19. 1. 2. 2. dorim să vedem cu cine au votat alegătorii din lotul nostru la ultimele alegeri prezidenţiale. 2. 43. 2. 41. 2. 1. frecvenţa observată. 22. 2. categoriile sale. Se observă faptul că în câmpul EXPECTED VALUES este bifată opţiunea ALL CATEGORIES EQUAL. 2. vom compara frecvenţa cu care oamenii au votat cei doi candidaţi. 34. 1. 2. 2. 1. 2. în care categoriile nu s-ar mai fi distribuit egal. 2 VOT: 2. 2. 2 GR_MULT: 1. Deci. 1. 37. atunci foloseam opţiunea VALUES şi butonul ADD. 51. 2. 2. ceea ce semnifică faptul că se va compara situaţia reală a votului cu situaţia în care candidaţii ar obţine acelaşi număr de voturi. 2. 2. 2. 2. 54. 3. 2. folosind testul chi pătrat. 1. 21. 1. 29 GEN: 1. 38. 1. 3. cea teoretică la care se face raportarea şi abaterile frecvenţei observate de la frecvenţa teoretică (coloana RESIDUALS). 2. 1. 2. 23. 1. 1. 35. 325 .NONPARAMETRIC TESTS opţiunea CHI-SQUARE: Vom introduce variabila VOT în câmpul pentru analiză (TEST VARIABLES LIST). 27.

Toate testele neparametrice ce compară două eşantioane independente au la bază comparaţii ale rangurilor diferitelor intervale observate. care se bazează pe ierarhia rangurilor observaţiilor din cele două grupuri. prezentată în tabelul al doilea ( χ 2 = 5. ci calitativă şi ordinală. Semnificativ mai mulţi oameni au votat pe Băsescu ca preşedinte comparativ cu cei care lau votat pe Geoană. Vom trece variabila dependentă (GR_MULT) în câmpul TEST VARIABLE LIST. iar variabila independentă (GEN) în câmpul GROUPING VARIABLE.sav). este semnificativă (p=0. În foaia cu rezultate apar următoarele tabele: 326 . Deci oamenii au votat în mod semnificativ diferit cei doi candidaţi la preşedinţie. vom folosi MANN-WHITNEY U. Testul se activează din meniul ANALYZE . Folosirea SPSS Pentru a ilustra aplicarea testului vom utiliza baza de date creată anterior (baza9.NON-PARAMETRIC TESTS opţiunea TWO INDEPENDENT SAMPLES: Fereastra care apare pe ecran semănă foarte mult cu cea care apare la activarea testului t pentru eşantioane independente. IV. Dintre cele patru tipuri de teste. TWO INDEPENDENT SAMPLES Aceste teste sunt echivalentul testului t pentru eşantioane independente.2. doar că în acest caz variabila dependentă măsurată nu este cantitativă.LOREDANA GHERASIM Valoarea statistică a testului.018) la un grad de libertate. Vom analiza dacă apr diferenţe între subiecţii de gen masculin şi cei de gen feminin în ceea ce priveşte gradul de mulţumire faţă de situaţia actuală a ţării. la fel ca şi în cazul testului t.55 ). Grupurile variabilei independente se definesc folosind butonul DEFINE GROUPS.

1. 3. Dacă diferenţele ar fi fost semnificative (p<0.medie şi 3 . sensul diferenţei ar fi fost dat de semnul notei Z. 2. 3. 2. TWO RELATED SAMPLES Metodele care compară două eşantioane perechi sunt similare aplicării testului t pentru eşantioane perechi. 3. 1.050. 2. 2.05). 2. Pentru a ilustra aplicarea acestui test vom folosi o nouă bază de date (baza10. 3. 2. pentru cei de gen feminin are valoarea 9. 3. 2 PSD: 2. 2. 3. 1. scrisă imediat deasupra valorii pragului de semnificaţie. 2. Se foloseşte din meniul NON PARAMETRIC TESTS opţiunea TWO RELATED SAMPLES. 1. 1. 3. 1. 2. 1. Deoarece subiecţii răspund la ambele întrebări trebuie aplicată o metodă care să permită compararea eşantioanelor perechi.778) este mai mare de 0. SIG). variabila are trei valori 1 . Astfel. 1. Fereastra seamănă cu cea a testului t pentru eşantioane perechi. 1. pentru a se activa opţiunile ferestrei. 1. Prezentăm rezultatele subiecţilor: Alinata: 1.importanta. 1. 1. 2. 1. 2. Valoarea pragului de semnificaţie (p=0. 1. în primul tabel este prezentată situaţia „descriptivă" (media rangurilor). 1.importanta. 2. 1. 1. 2 . Pentru exemplul nostru vom selecta variabile ALIANTA şi PSD şi le vom trece în câmpul din stânga: 327 .17. 2 . 2. 3. 2.slabă). 2 Dorim să vedem dacă subiecţii au o părere mai bună despre unul dintre cele două partide politice. 2. iar valoarea pragului de semnificaţie a testului este dată în tabelul al doilea (linia denumită ASYMP. 2. 2.3.medie şi 3 . 1. 2. 1. rangul mediu pentru subiecţii de gen masculin are valoare 9. trebuie selectată o pereche de variabile pentru analiză.slabă) şi PSD (cuprinde răspunsurile subiecţilor la itemul „Evaluaţi contribuţia alianţei în integrarea europeană”.sav) care cuprinde două variabile: ALINATA (cuprinde răspunsurile subiecţilor la itemul „Evaluaţi contribuţia alianţei în integrarea europeană”. 1. deci putem trage concluzia că femeile şi bărbaţii din studiul nostru nu diferă semnificativ în ceea ce priveşte gradul de mulţumire cu privire la situaţia actuală a ţării. 3. Ca şi la acest test. 1. variabila are trei valori 1 . IV.ANALIZA COMPUTERIZATĂ A DATELOR Observaţi că stilul de prezentare al rezultatelor este similar cu cel de la testul chi-pătrat.83.

328 .LOREDANA GHERASIM Vom utiliza testul WILCOXON. ca mai jos: În primul tabel apare media şi suma rangurilor diferenţelor pozitive şi negative. în foaia cu rezultate. Prezentarea rezultatelor testului. Indicii de sub acest tabel arată sensul diferenţelor.281). care se bazează pe rangul valorilor absolute al diferenţelor dintre două variabile. Din al doilea tabel observăm că testul este nesemnificativ (p=0. unul pentru valorile descriptive şi altul pentru semnificaţia testului. se face în două tabele. Aceste rezultat indică faptul că oamenii consideră ca ambele partide contribuie la fel de mult la integrarea României în Uniunea Europeană. comparând separat diferenţele pozitive şi negative. precum şi cazurile în care scorurile sunt la egalitate.

Sign up to vote on this title
UsefulNot useful