P. 1
Analiza datelor

Analiza datelor

|Views: 2,200|Likes:
Published by criss890

More info:

Published by: criss890 on Jun 18, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

07/01/2013

pdf

text

original

Sections

  • I.1. TIPURI DE VARIABILE. DIFERENŢA DINTRE VARIABILE, VALORI ŞI SCORURI
  • I.2. PREZENTAREA APLICAŢIEI SPSS
  • I.3. DESCHIDEREA UNEI BAZE DE DATE
  • I.4. CREAREA UNEI NOI BAZE DE DATE
  • II.1. ANALIZA FRECVENŢELOR
  • II.2. IDENTIFICAREA TENDINŢEI CENTRALE ŞI A VARIABILITĂŢII SCORURILOR
  • II.3. SCORURILE Z
  • II.4. COEFICIENTUL DE CORELAŢIE PEARSON
  • II.5. COEFICIENTUL DE CORELAŢIE KENDALL'S TAU-B
  • II.6. COEFICIENTUL DE CORELAŢIE SPEARMAN
  • II.7. RECODIFICAREA ŞI TRANSFORMAREA VARIABILELOR
  • III.1. DISTRIBUŢIA NORMALĂ
  • III.2. ETAPELE TESTĂRII UNEI IPOTEZE. TESTUL Z
  • III.3. TESTUL T PENTRU COMPARAREA UNUI EŞANTION CU MEDIA POPULAŢIEI
  • III.4. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE PERECHI
  • III.5. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE INDEPENDENTE
  • III.6. ANALIZA DE VARIANŢĂ - ANOVA UNIFACTORIAL
  • III.7. ANOVA UNIVARIATE
  • III.8. ANOVA REPETED MEASURES
  • IV.1. TESTUL CHI PĂTRAT
  • IV.2. TWO INDEPENDENT SAMPLES
  • IV.3. TWO RELATED SAMPLES

LECT.DR.

LOREDANA GHERASIM

ANALIZA COMPUTERIZATĂ A DATELOR

CUPRINS
I. FAMILIARIZAREA CU PROGRAMUL SPSS 10.0 Diferenţa dintre variabile, valori şi scoruri 2. Prezentarea aplicaţiei SPSS 3. Deschiderea unei baze de date 4. Crearea unei noi baze de date II. ELEMENTE DE STATISTICĂ DESCRIPTIVĂ 1. Analiza frecvenţelor 2. Identificarea tendinţei centrale şi a variabilităţii 3. Scorurile Z 4. Coeficientul de corelaţiei Pearson 5. Coeficientul de corelaţiei Kendall’s tau-b 6. Coeficientul de corelaţiei Spearman 7. Recodificarea şi transformarea variabilelor III. ELEMENTE DE STATISTICĂ INFERENŢIALĂ 1. Distribuţia normală 2. Etapele testării unei ipoteze. Testul Z 3. Testul t pentru compararea unui eşantion cu media populaţiei 4. Testul t pentru compararea a două eşantioane perechi 5. Testul t pentru compararea a două eşantioane independente 6. Analiza de varianţă – ANOVA unifactorial

1. Tipuri de variabile

7. ANOVA univariate 8. ANOVA repeted measures IV. DATE NEPARAMETRICE
1. Testul Chi pătrat 2. Two independent samples 3. Two related samples

SCOPUL UNITĂŢII DE CURS ▪ oferă noţiuni, explicaţii şi aplicaţii pentru a înţelege şi opera eficient cu programul SPSS 10.0 în scopul prelucrării statistice a datelor. OBIECTIVE OPERAŢIONALE În urma studierii acestei unităţi de curs, studenţii: ▪ vor putea să definească variabilele şi să conceapă o bază de date adecvată; ▪ vor redefini şi transforma variabile; ▪ vor prelucra datele statistice la nivel descriptiv; ▪ vor realiza analiza corelaţională a datelor şi vor interpreta rezultatele obţinute; ▪ vor folosi testul t pentru compararea unui eşantion cu o populaţie şi a două eşantioane (perechi sau independente) şi vor interpreta rezultatele obţinute; ▪ vor utiliza analiza de varianţă pentru analiza efectului unui singur factor şi vor interpreta rezultatele obţinute; ▪ vor utiliza analiza de varianţă pentru analiza efectelor de interacţiune; ▪ vor utiliza metode non-parametrice de analiză a datelor. EVALUARE ▪ 40% din nota finală examen practic care presupune prelucrarea şi interpretarea datelor; ▪ 60% din nota finală evaluările de pe parcursul seminariilor, care vor presupune prelucrări şi analize statistice ale datelor.

OBSERVAŢIE !!! Cursul nu epuizează opţiunile programului SPSS şi nu suplineşte lipsa informaţiilor statistice teoretice.

ANALIZA COMPUTERIZATĂ A DATELOR

I. FAMILIARIZAREA CU PROGRAMUL SPSS 10.0
I.1. TIPURI DE VARIABILE. DIFERENŢA DINTRE VARIABILE, VALORI ŞI SCORURI Variabile sunt definite ca proprietăţi ale fenomenelor, obiectelor sau proceselor, care pot lua diferite valori. Există mai multe criterii în funcţie de care se pot clasifica variabilele: după natura măsurii variabilele pot fi: cantitative (variază cantitativ, cum ar fi de exemplu greutatea sau vârsta subiecţilor) sau calitative (sunt cele care variază calitativ, cum ar fi genul sau etnia subiecţilor); după felul variaţiei, variabilele pot fi: continui (teoretic pot lua orice valoarea, între două valori ale variabilei putând să apară o a treia valoare; vârsta subiecţilor este un exemplu de variabilă continuă) sau discrete (pot avea numai anumite valori, între care nu mai apar altele; religia, tipurile temperamentale sunt exemple de variabile discontinui); după scopul folosirii lor în studii experimentale: independente (sunt variabilele manipulate de experimentator şi care se presupune că influenţează variabila dependentă) sau dependente (reprezintă răspunsurile subiecţilor). O variabilă poate lua diferite valori. Valoarea reprezintă o măsură calitativă sau cantitativă a unui fenomen. Spre exemplu, pentru variabila “nota şcolară” valorile acesteia sunt toate notele de la 1 la 10. Pentru variabila “zilele săptămânii” valorile sunt toate cele şapte zile ale săptămânii. În psihologie se face distincţia între valori şi scoruri. Scorul este valoarea obţinută de o persoană, fenomen sau obiect atunci când ne referim la o anume variabilă. Spre exemplu, nota pe care o obţine un elev la o materie (să zicem 7) reprezintă scorul subiectului la variabila “nota şcolară”. I.2. PREZENTAREA APLICAŢIEI SPSS SPSS (în traducere Pachet statistic pentru ştiinţele sociale) este numele unui pachet de programe care ajută la analiza datelor obţinute în cercetările din domeniul ştiinţelor sociale. Deschiderea programului se poate face cu ajutorul mouse-ului, cu dublu-click asupra pictogramei programului de pe desktop. Aplicaţia mai poate fi deschisă de la butonul START/PROGRAME, opţiunea SPSS FOR WINDOWS, ca în imaginea de mai jos:

Oricare ar fi metoda de deschidere a programului, pe ecran va apărea următoarea fereastră:

251

LOREDANA GHERASIM

Prima bară din partea de sus a ferestrei oferă informaţii despre denumirea aplicaţiei şi numele fişierului cu care se lucrează. Urmează bara de meniuri a programului şi cea cu butoane. Foia cu date este organizată tabelar. Întotdeauna coloanele tabelului reprezintă variabilele studiului, în timp ce liniile, rândurile numerotate ale tabelului reprezintă subiecţii cercetării. În partea de jos a ferestrei sunt două opţiuni: DATA VIEW şi VARIABLE VIEW. Putem vizualiza datele brute ale subiecţilor, dacă este activă opţiunea DATA VIEW sau putem vizualiza descrierea variabilelor introduse în baza de date, dacă este activată opţiunea VARIABLE VIEW. De obicei, atunci când deschidem programul, este activă opţiunea DATA VIEW, cum se poate observa şi în imaginea de mai sus. Printr-un simplu click stânga pe opţiunea VARIABLE VIEW, pe ecran apare un alt tabel care permite definirea variabilelor din baza de date: Din meniul FILE putem alege comanda deschidere a unei noi baze de date (opţiunea NEW DATA) sau a unei noi foi de rezultate (NEW OUTPUT): Acest program prezintă rezultatele prelucrărilor statistice într-o pagină separată, numită OUTPUT. Comenzile care sunt colorate în gri sunt comenzi inactive pentru că baza de date nu conţine, deocamdată, nici o informaţie. Din acest meniu putem deschide, folosind opţiunea OPEN, o bază de date care a fost creată anterior (DATA) sau un fişier cu rezultatele prelucrărilor statistice anteriore (OUTPUT).

252

ANALIZA COMPUTERIZATĂ A DATELOR Comanda SAVE permite salvarea obişnuită a fişierului cu date sau cu rezultate. I. comanda SAVE AS permite salvarea unui fişier modificându-i numele. directie. gr_mult. fişierele cu baze de date au întotdeauna extensia sav) care se găseşte la adresa C:\MY DOCUMENTS\EXEMPLE SPSS. subiectul de pe rândul 9 are valoare 3 la variabila gr_mult. valorile numerice din fiecare coloană reprezentând scorurile subiecţilor la aceste variabile. Opţiunile RECENTLY USED DATA şi RECENTLY USED FILES deschid bazele de date şi foile cu rezultate recent create sau utilizate în programul SPSS. În momentul încărcării bazei de date pe ecran va apărea următoarea imagine: Valorile din baza de date reprezintă răspunsurile brute ale subiecţilor. Pentru a vedea ce înseamnă fiecare dintre aceste variabile trebuie activată opţiunea VARIABLE VIEW: 253 . CUT şi PASTE sunt folosite pentru copierea sau mutarea datelor din celule. Pe coloane sunt definite variabilele. prezent. Vom deschide fişierul opinii. guv. Rândurile conţin răspunsurile subiecţilor la diferiţi itemi. După activarea comenzii pe ecran apare o casetă de dialog care permite selectarea directorului şi respectiv fişierului care conţine baza de date. Din meniul EDIT. comenzile COPY. DESCHIDEREA UNEI BAZE DE DATE Pentru deschiderea unei baze de date create anterior se activează meniul FILE/OPEN opţiunea DATA. Copierea sau mutarea datelor presupune selectarea datelor.sav (în aplicaţia SPSS. rânduri sau coloane. activarea comenzii COPY/CUT din meniul EDIT. 4 la variabila viitor etc. De exemplu. parlam). În această bază de date avem pe coloană variabile (ca de exemplu.3. plasarea cursorului în noua locaţie şi apoi activarea comenzii PASTE. valoarea 3 la variabila prezent. viitor.

CREAREA UNEI NOI BAZE DE DATE Pentru a crea o nouă bază de date trebuie activată opţiunea DATA VIEW. apoi se introduce numele variabilei NRSUB folosind tastatura. Definirea variabilelor presupune activarea câmpului VARIABLE VIEW. Baza de date va conţine patru variabile: numărul subiecţilor (nrsub). I. De exemplu. înainte şi după intervenţia terapeutică (anxietatea a fost măsurată cu ajutorul unei scale de anxietate). Această opţiune poate fi activată cu ajutorul mouse-ului cu un click stânga pe butonul gri din celula corespunzătoare variabilei. iar indicativul primei linii devine activ. Pentru a defini o variabilă. Pentru introducerea datelor se plasează cursorul în celulă şi se introduce valoarea cu ajutorul tastelor.4. Rezultatul va fi următorul: Numele variabilei poate să cuprindă maxim opt caractere. fără spaţiu sau semne de punctuaţie. prin executarea unui dublu click pe numele variabilei (în cazul nostru var0001) sau prin activarea butonului VARIABLE VIEW din partea de jos a câmpului. 254 . coloanele reprezentând diferite caracteristici ale variabilelor. După introducerea primei valori automat programul a denumit prima variabilă (var0001). trebuie plasat cursorul în celula în care este trecut numele (NAME) generic al variabilei (var0001). nivelul anxietăţii subiecţilor înaintea terapiei (ANX1) şi nivelul anxietăţii subiecţilor după terapie (ANX2) şi genul subiecţilor (1-subiecţi de gen masculin şi 2-subiecţi de gen feminin). La fel se vor introduce şi celelalte valori ale primei variabile. Opţiunea TYPE permite specificarea tipului de date. La studiu au participat subiecţi de gen feminin şi masculin. variabila gr_mult este o variabilă de tip numeric.LOREDANA GHERASIM Variabilele sunt aşezate pe rânduri. reprezentând itemul „Cât de mulţumit sunteţi în general de felul în care trăiţi?”. Pentru a utiliza cu uşurinţă datele este indicată definirea sau redenumirea variabilelor cu care lucrăm. Spre exemplificare. cu 20 de caractere la partea întreaga şi 0 zecimale. vom introduce prima valoare (1) a primei variabile. Vom crea o baza de date care să conţină rezultatele la anxietate obţinute de un număr de subiecţi.

În acest scop vom activa opţiunea VALUE: 255 . dreapta sau central. Automat la crearea unei noi baze de date. afectând vizualizarea datelor. subiecţii de sex masculin îi vom codifica cu valoarea 1. Este posibilă alegerea numărului de cifre pentru partea întreagă (WIDTH) şi a numărului de zecimale (DECIMAL PLACES). cu sau fără separator pentru mii. în funcţie de această caracteristică subiecţii fiind împărţiţi în două categorii distincte. DATE permite folosirea spaţiilor. Acest lucru presupune atribuirea de valori şi etichete celor două grupuri de subiecţi. Deşi sunt mai multe tipuri de variabile. Variabila Gen este de tip categorial. punctelor. VALUE LABEL permite descrierea valorile pe care le poate lua o variabilă. presupunându-se că noile variabile vor fi numerice.ANALIZA COMPUTERIZATĂ A DATELOR Tipul NUMERIC permite introducerea valorilor cu sau fără zecimale. Tipul DOLLAR inserează în faţa valorilor simbolul dolarului. Din acest motiv trebuie precizată semnificaţia valorilor variabilei. Caracteristica LABELS permite definirea detaliată a variabilei (pot fi folosite până la maxim 256 caractere. ANX1. Tipul SCIENTIFIC NOTATION transformă logaritmic valorile introduse. iar CUSTOM CURRENCY permite introducerea de valorilor pozitive dar şi a celor negative. ALIGNMENT permite modificarea modului în care sunt prezentate datele pe ecran. MISSING VALUES permite stabilirea valorilor care nu vor fi luate în seamă la prelucrarea datelor. Definirea detaliată a variabilei apare în pagina de rezultate. apare selectat tipul NUMERIC. aliniate la stânga. vom defini numele variabilei NRSUB şi vom detalia eticheta la opţiunea LABEL ca în imaginea de mai jos: Vom introduce valorile şi vom defini şi următoarele variabile. COLUMN permite specificarea numărului de caractere pentru o coloană. lunile şi anii. reţinând întreaga valoare. Tipurile COMMA şi DOT permit introducerea valorilor cu orice număr de zecimale (mai mare de 16). iar pe cei de gen feminin cu valoarea 2. În exemplu nostru. NUMERIC şi STRING (foarte rar). Opţiunea TYPE este de obicei folosită pentru modifica acest tip de date. în psihologie se utilizează două tipuri de variabile. ANX2 şi Gen. Opţiunea este folosită pentru variabile care folosesc coduri numerice pentru a reprezenta categorii (de exemplu. respectiv orele şi minutele. femei şi bărbaţi. a barelor de separarea pentru a delimita zilele. inclusiv spaţiul). se pot folosi valorile 1 şi 2 pentru a codifica genul feminin şi masculin). Astfel. virgulelor. Ultima opţiune STRING permite introducerea variabilelor alfanumerice.

apoi vom scrie „2” în câmpul VALUE şi „subiecţi de gen feminin” în câmpul VALUE LABEL şi activăm butonul ADD. Această opţiune se foloseşte numai pentru variabilele categoriale. care împart subiecţii în grupuri distincte. Salvarea fişierelor se face fie acţionând butonul SAVE care se găseşte în bara de instrumente.LOREDANA GHERASIM Se trece valoarea în câmpul VALUE şi numele grupului sau categoriei în câmpul VALUE LABEL. Vom salva fişierul cu numele Baza1. Reamintim că trebuie ales mai întâi directorul în care vream să salvăm fişierul si apoi scriem numele fişierului. Se activează butonul OK pentru a salva modificările şi închide caseta de dialog.sav în subdirectorul EXEMPLE SPSS care se găseşte în directorul MY DOCUMENTS. Astfel. fie din meniul FILE se alege opţiunea SAVE. după care se apasă butonul ADD. 256 . vom scrie „1” în câmpul VALUE şi „subiecţi de gen masculin” în câmpul VALUE LABEL şi activăm butonul ADD.

care permit înţelegerea tendinţei unui grup de scoruri. Din această perspectivă. adică elevii au tendinţa de a obţine mai multe note mari. distribuţiile pot fi unimodale (au un singur vârf).ANALIZA COMPUTERIZATĂ A DATELOR II. distribuţiile fiind aproximativ simetrice (nu prezintă tendinţă de înclinare). Turtirea unei distribuţii se raportează la curba normală. înălţimea barelor corespunzând frecvenţei fiecărui interval de frecvenţă din tabelul de frecvenţă. ELEMENTE DE STATISTICĂ DESCRIPTIVĂ II. arată valorile în jurul cărora se grupează rezultatele subiecţilor. prezentând modul în care se distribuie sau se împrăştie cazurile sau frecvenţele. distribuţia este înclinată pozitiv. O distribuţie este înclinată atunci când are o extremă (o parte) mai împrăştiată şi mai lungă. Atunci când curba este înclinată spre dreapta. ANALIZA FRECVENŢELOR Tabelele de frecvenţă ajută la descrierea unui grup de scoruri. mai comprehensibilă. iar când curba este înclinată spre stânga. prin unirea mijloacelor părţilor superioare ale barelor histogramelor. cu alte cuvinte. Spre exemplu. Cele mai multe aspecte măsurate în psihologie prezintă un număr aproximativ egal de cazuri de o parte şi de alta a mijlocului. Modalitatea. astfel. Histogramele. notele şcolare au o distribuţie înclinată spre dreapta. Înclinarea arată dacă în distribuţie apar mai multe valori mari sau mai multe valori mici. Modalitatea indică câte “vârfuri” are o distribuţie.1. bimodale (au două vârfuri) sau multimodale (au mai multe vârfuri). Tabelele de frecvenţa grupează scorurile subiecţilor. histograma şi poligonul de frecvenţă descriu o distribuţie de frecvenţă. informaţia devenind. Poligoanele de frecvenţă sunt o altă modalitate de reprezentare grafică a datelor din tabelele de frecvenţă. reprezentări grafice ale tabelelor de frecvenţă permit o mai bună înţelegere a tendinţei grupului de rezultate. Acestea presupun transformarea intervalelor de frecvenţă în bare. distribuţia este înclinată negativ. Tabelul de frecvenţă. Aceasta se găseşte la meniul ANALYZE – DESCRIPTIVE STATIASTICS: 257 . Acestea se obţin. Faţă de curba normală o distribuţie poate fi mai turtită (scorurile din cadrul ei variază foarte mult de la medie) sau mai ascuţită (scorurile variază foarte puţin de la medie). Analiza de frecvenţă cu ajutorul programului SPSS Opţiunea FREQUENCIES permite realizarea tabelului de frecvenţă şi a distribuţiei de frecvenţă a rezultatelor. fiind cele mai simple procedee ale statisticii descriptive. înclinarea şi turtirea sunt indicatori care descriu forma distribuţie scorurilor.

plăcintă sau histogramă). Opţiunea STATISTICS deschide o fereastră cu opţiuni de prelucrare statistică. Pentru afişarea histogramei de frecvenţă se activează butonul CHARTS: Opţiunea CHART TYPE permite alegerea unui tip de grafic (cu bare.LOREDANA GHERASIM După activarea opţiunii pe ecran apare următoarea casetă de dialog: În câmpul din stânga al casetei FREQUENCIES sunt afişate toate variabilele din baza de date. analiza statistică se realizează doar pentru variabilele trecute în acest câmp. Opţiunea FORMAT permite modificarea formei de prezentare a datelor în foia cu rezultate (OUTPUT). Se selectează din câmpul din stânga variabila pe care vrem să analizăm apoi se activează butonul de trecere. CHART VALUES permite alegerea tipului de valori afişate în grafic (Frecvenţe sau Procentaje). butonul CHARTS permite afişarea histogramei de frecvenţă. împreună cu denumirea extinsă a variabilei. Pentru exemplul nostru se selectează opţiunea HISTOGRAMS. Trecerea variabilelor în câmpul de analiză se realizează cu ajutorul butonului cu săgeată care se găseşte între câmpuri. dorim realizarea tabelului de frecvenţă şi histogramei pentru variabila „nivelul anxietăţii înainte de terapie” (ANX1). se bifează afişarea curbei normale (WITH NORMAL CURVE). Pentru exemplul nostru. Activarea acestui buton are ca efect apariţia următoarei casete de dialog: 258 . Câmpul din dreapta reprezintă câmpul de analiză. Acest mod de organizare în două câmpuri apare la aproape toate opţiunile de prelucrare a datelor. Opţiunea FORMAT permite modificarea formei OUTPUT-ului. Se selectează variabila ANX1 din câmpul din stânga şi se activează butonul de trecere: Pentru ca în foaia de rezultate să apară tabelul de frecvenţă se selectează opţiunea DISPLAY FREQUECY TABLES. apoi se activează butonul CONTINUE. Bifarea opţiunii DISPLAY FREQUECY TABLES are ca efect afişarea în foaia de rezultate a tabelul de frecvenţă. în ordinea introducerii lor în baza de date. Astfel.

Dacă unii subiecţi nu ar fi răspuns la chestionarul de anxietate. numită OUTPUT: Fereastra OUPUT este organizată în două câmpuri. Pe ecran apare o fereastra cu rezultate. Coloana FREQUENCY prezintă frecvenţa. De exemplu. În primul tabel se precizează numărul de subiecţi şi numărul de răspunsuri. În cazul nostru coloanele PERCENT şi VALID PERCENT sunt identice deoarece toţi subiecţii au scoruri la această variabilă. iar cel din dreapta arată conţinutul foii cu rezultate. iar cel din dreapta conţine opţiuni de prezentare comparativă a rezultatelor şi de organizare separată a foii de rezultate. vom păstra opţiunile selectate automat. După selectarea opţiunilor de realizare a tabelului de frecvenţă şi histogramei. 60% dintre subiecţi au note mai mici sau egale cu 106. ceea ce reprezintă 10% din totalul numărului de răspunsuri obţinute. Derulând pagina cu rezultate sau selectând HISTOGRAM în câmpul din stânga. Coloana CUMULATIVE PERCENT prezintă procentajul cumulat. afişează structura sau cuprinsul OUPUT-ului. adică numărul de subiecţi care obţin o anumită valoare. Coloana PERCENT transformă frecvenţa obţinută pentru fiecare valoare în procentaj ţinând cont de numărul total de subiecţi luaţi în calcul. pentru fiecare variabilă.ANALIZA COMPUTERIZATĂ A DATELOR Câmpul din stânga al ferestrei conţine opţiuni de aranjare a rezultatelor (în ordine descrescătoare sau crescătoare a valorilor sau cantităţilor). avem 20 de subiecţi care au răspuns la chestionar (nu lipseşte nici o valoare). indiferent dacă aceştia au sau nu scoruri la această variabilă. Pentru exemplu nostru. putem vizualiza reprezentarea grafică a frecvenţei scorurilor: 259 . Spre exemplu. Coloana VALID prezintă valorile variabilei. cel din stânga. Rezultatele sunt organizate în două tabele. Pentru exemplul nostru. Al doilea tabel este organizat în cinci coloane. doi subiecţi au obţinut scorul 103. prezentate în ordine crescătoare (fără a ţine seama de cazurile lipsă). se activează butonul OK al casetei FREQUENCIES. de la cel mai mic scor la până la cel mai mare. VALID PERCENT prezintă procentajul luând în calcul doar subiecţii care au răspuns la această variabilă. atunci cele două coloane ar fi conţinut valori diferite.

câmpul în care se introduce variabila pentru care dorim să realizăm histograma de frecvenţă 3. IDENTIFICAREA TENDINŢEI CENTRALE ŞI A VARIABILITĂŢII SCORURILOR Metodele descriptive pentru identificarea tendinţei centrale şi de împrăştiere indică tendinţa centrală a unui grup de scoruri. Media aritmetică descrie tendinţa centrală într-un grup de rezultate. Vizualizarea ferestrei OUTPUT sau DATE (baza1. selectarea acestei opţiuni va duce la afişarea curbei normală de distribuţie a rezultatelor.2. folosind ca indicatori varianţa şi abaterea standard. mediana şi modul şi tendinţa de împrăştiere a grupului de scoruri. în câmpul VARIABLE şi bifăm opţiunea DISPLAY NORMAL CURVE. reprezentativă a unui grup de scoruri. Activarea opţiunii duce la apariţia următoarei casete de dialog: 2 1 3 Elementele principale ale ferestrei sunt: 1.LOREDANA GHERASIM Histograma de frecvenţă se mai poate obţine folosind meniul GRAPHS – HISTOGRAM. Pentru exemplificare introducem variabila ANX1. folosind ca indicatori media.sav) se poate face folosind meniul WINDOW. deoarece abaterile de la medie într-o direcţie (abaterile scorurilor mici de la medie) sunt egale cu 260 . Media este punctul faţă de care scorurile sunt egal depărtate. arată valoarea tipică. Se obţine aceeaşi reprezentare grafică ca şi în cazul folosirii butonului CHART al ferestrei FREQUENCIES. cu ajutorul butonului cu săgeată. marcând opţiunea dorită (baza de date sau foaia de rezultate): II. câmpul în care sunt prezentate toate variabilele din baza de date 2.

ANALIZA COMPUTERIZATĂ A DATELOR abaterile în cealaltă direcţie (abaterile scorurilor mari de la medie). acest indicator intrând în componenţa multor metodele statistice. „Baza1. Pentru analiză vom folosi baza de date realizată anterior. Este o măsură a gradului de variabilitate a scorurilor şi arată cât de mult se abat scorurile de la tendinţa centrală. Este indicatorul care este cel mai puţin afectat de schimbările structurii (modificări ale numărului de scoruri sau mărimii scorurilor distribuţiei). este cea mai “sensibilă” la modificarea numărului de scoruri sau mărimii scorurilor. care sunt mai stabile sunt recomandate pentru descrierea distribuţiilor asimetrice şi multimodale. cu atât mai mult se împrăştie scorurile în jurul valorii centrale. Se recomandă utilizarea mediei în distribuţiile simetrice şi unimodale. Mediana este şi ea destul de puţin afectată de modificările structurii distribuţiei. casetă de dialog care se deschide cuprinde patru câmpuri cu opţiuni: 261 . însă. Media. tipice. Abaterea standard este rădăcina pătrată a varianţei (SD = SD 2 ). normale m+SD scoruri mari Scorurile care sunt mai mari decât media cu o abatere standard sunt considerare scoruri mari iar cele mai mici decât media cu mai mult de o abatere standard sunt considerate ca fiind scoruri slabe. Cu cât este mai mare această valoare. Ilustrăm grafic acest lucru: m-SD scoruri mici m scoruri medii. media aritmetică rămâne metoda cel mai des utilizată pentru descrierea tendinţei grupului de scoruri. fiind indicatorul cel mai descriptiv (deoarece indică orice modificare survenită în distribuţie). Calculul tendinţei centrale şi a variabilităţii folosind SPSS Meniul din SPSS care permite calculul indicatorilor tendinţei centrale şi ai împrăştierii se găseşte la ANALYZE – DESCRIPTIVE STATISTICS – FREQUENCIES. Mai precis. Trebuie să cunoaştem gradul de variabilitate a scorurilor noastre. Abaterea standard ne arată cu cât se împrăştie scorurile în jurul valorii centrale şi se măsoară în aceleaşi unităţi de măsură ca şi scorurile iniţial. Se trece variabila în câmpul din dreapta apoi se activează butonul STATISTICS. Mediana împarte distribuţia în două părţi egale. Pentru a cunoaşte exact cu cât variază scorurile în medie este nevoie să calculăm deviaţia standard. Vom calcula parametrii tendinţei centrale şi ai variabilităţii pentru variabila ANX1 (nivelul anxietăţii înaintea terapiei).sav”. indică gradul de variabilitate a unui grup de rezultate. Mediana şi modulul. Cunoaşterea acestor indicatori nu este suficientă pentru a descrie complet o distribuţie. iar cealaltă jumătate valori mai mari. jumătate dintre scorurile distribuţie având valori mai mici ca mediana. Cu toate acestea. trebuie să ştim cât de mult (sau cu cât) se împrăştie scorurile în jurul valorii medii. Aceste rezultate sunt considerate tipice sau normale pentru o distribuţie. Există însă metode statistice (cum a fi testele neparametrice) în care se utilizează doar mediana şi modul. În intervalul cuprins între medie şi o abatere standard la stânga şi dreapta mediei găsim aproximativ 2/3 din totalul scorurilor. După cum se poate vede şi în imaginea de mai jos. Modul reprezintă valoarea cu frecvenţa cea mai mare. Varianţa (SD2=( ∑ (X-M)2/N) unei distribuţii arată cât de “împrăştiate” sunt scorurile în jurul valorii centrale.

Câmpul DISTRIBUTION oferă posibilitatea aflării indicatorilor de turtire (KURTOSIS)şi înclinare ai unei distribuţii în comparaţie cu cea normală (SKEWNESS). mod (MODE) şi suma valorilor seriei (SUM). Pentru exemplu nostru ne interesează calculul parametrilor tendinţei centrale ai distribuţiei şi de împrăştiere. MODE din câmpul CENTRAL TENDENCY şi opţiunile STD DEVIATION şi VARIANCE din câmpul DISPERSION: Activăm butonul CONTINUE şi apoi cel OK al casetei FREQUENCIES. DEVIATION). varianţă (VARIANCE). prin afişarea valorilor care delimitează aceste grupuri. MEAN care reprezintă abaterea standard a distribuţii tuturor mediilor posibile calculate pentru eşantioane aleatoare repetate).LOREDANA GHERASIM Câmpul PERCENTILE VALUES conţine opţiuni care permit calculul valorilor corespunzătoare împărţirii subiecţilor în grupuri egale.E. Această opţiune permite calculul cuartilelor (QUARTILES) sau altor cuartile (de exemplu CUT POINTS FOR 10 EQUAL GROUPS) sau centile (PERCENTILE). MEDIAN. CENTRAL TENDENCY conţine opţiunile folosite pentru calculul indicatorilor tendinţei centrale ale distribuţiei: media (MEAN). Valorile indicatorilor sunt grupate în tabelul Statistics: 262 . Opţiunile din câmpul DISPERSION permit calcularea diferiţilor parametri referitori la dispersia (împrăştierea) scorurilor în jurul valorii centrale: abatere standard (STD. amplitudine (RANGE). mediana (MEDIAN). valori minime (MINIMUM) şi maxime (MAXIMUM) şi eroare standard (S. În consecinţă se bifează (cu un simplu click stânga al mouse-ului) opţiunile MEAN.

Med=105. M=107. 263 . Mod=102. ceea ce însemnă că distribuţia este unimodală (apare o singură valoare la mod) şi uşor înclinată spre dreapta spre valorile mai mari ale variabilei (valoarea mediei este mai mare decât a medianei). Reprezentarea grafică indică apariţia unui singur vârf (distribuţie unimodală) şi o alungire şi împrăştiere a extremei drepte a distribuţiei (distribuţie înclinată spre dreapta). Rezultatele obţinute sunt următoarele: Astfel.95. La fel se calculează indicatorii tendinţei centrale şi de împrăştiere pentru variabila ANX2 (nivelul anxietăţii subiecţilor după terapie). Mod=104. Med=109. Distribuţia scorurilor subiecţilor la această variabilă indică aceeaşi formă.5.ANALIZA COMPUTERIZATĂ A DATELOR Astfel. Mod=110 (a doua valoare a modul se extrage din tabelul de frecvenţă). Distribuţia scorurilor este bimodală (apar două valori cu frecvenţa cea mai mare) şi înclinată spre valorile mici ale variabilei (media este mai mică decât mediana).90. M=107.5.

un scor x este considerat “mediu” dacă scorul său Z este cuprins în intervalul [–1. un scor x este considerat “mare” raportat la distribuţia Z. Nota standard Z arată cu câte deviaţii standard se abate un scor de la medie (Z=(X-M)/SD). distribuţia scorurilor pentru prima variabilă este mai ascuţită. putem analiza variabilitatea rezultatelor la cele două variabile. m-SD scoruri”mici” m scoruri medii. Mediei îi corespunde întotdeauna mereu scorul standard 0. Distribuţia în note Z este o distribuţie ideală în care media are întotdeauna valoarea 0. Schema de mai jos prezintă notele standard Z corespunzătoare mediei şi limitelor de variaţie maximă şi minimă. O altă funcţie a notelor z este aceea că permit compararea scorurilor obţinute de aceeaşi persoană la probe diferite. Permit compararea unui scor cu o distribuţie la care cunoaştem parametrii (media şi deviaţia standard). deoarece acestui scor îi corespunde un scor Z de +2 (ceea ce înseamnă că scorul este mai mare ca media cu două deviaţii standard). Scorurile Z îndeplinesc o serie de funcţii. dacă scorul său Z are valoare mai mică decât –1. un scor x raportat la distribuţia Z este considerat “mic”. 264 . Spre exemplu. La variabila ANX2 se constată o mai mare variabilitate a rezultatelor. Trebuie ţinut seama de o serie de reguli. o persoană cu scorul brut 130 este „de două ori mai deşteptă ca media celorlalţi”. valorile fiind mai grupate în jurul medie (şi varianţa şi abaterea standard au valori mai mici).LOREDANA GHERASIM Comparând reprezentările histogramele de frecvenţă pentru variabilele ANX1 şi ANX2. tipice normale m+SD scoruri”mari” x -1 0 +1 Z Aceasta distribuţie ne permite să stabilim cum este scorul x în raport cu media (care este 0) şi abaterea standard (care are valoarea 1). +1]. Astfel. Astfel. iar abaterea standard valoarea 1. notele Z arată de câte ori acel scor este mai mare sau mai mic decât media (ţinând cont de variabilitate). ne ajută să precizăm dacă un scor este mic. limitei minime de variaţie tipică îi corespunde scorul standard -1. II. astfel. dacă scorul său Z va fi mai mare decât +1. întrucât notele Z arată raporturi şi sunt adimensionale (nu depind de ceea ce măsurăm). De asemenea. dacă scorurile la un test de inteligenţă într-o populaţia sunt descrise de media m=100 şi deviaţia standard SD=15. mediu sau mare. iar limitei maxime de variaţie normală îi corespunde nota standard +1. SCORURILE Z Nota Z indică deviaţia unui scor (x) de la medie (m) exprimată în deviaţii standard. distribuţia fiind mai turtită (în acest caz varianţa şi abaterea standard au valori mai mari).3.

4. opţiunea SAVE STANDARDIZED VALUES AS VARIABLES permite salvarea în baza de date a scorurilor standard sub forma unei noi variabile.sav”). abaterii standard şi al valorii minime şi maxime. câmpul în care sunt prezentate variabilele din baza de date 2. Vom folosi baza de date creată anterior („Baza1. Se bifează opţiunea SAVE STANDARDIZED VALUES AS VARIABLES. permite calculul notelor Z cu ajutorul SPSS. câmpul în care se introduc variabilele care vor fi analizate 3. Pentru exemplificare.ANALIZA COMPUTERIZATĂ A DATELOR Calculul notelor Z folosind SPSS Comanda DESCRIPTIVES care se găseşte în meniul ANALYZE – DESCRIPTIVE STATISTICS. Activarea comenzii duce la apariţia pe ecran a casetei de dialog următoare: 1 2 3 4 Prezentăm principalele elemente ale ferestrei DESCRIPTIVES: 1. care deschide următoarea fereastră: Automat sunt selectate de computer opţiunile de calcul al mediei. Se activează butonul OPTIONS. Vom activa butonul CONTINUE şi apoi butonul OK al ferestrei pentru a putea face 265 . cuprinde opţiuni de calcul ai parametrilor distribuţiei. vom calcula notele Z pentru variabila ANX1.

cu numele ZANX1. Vom vizualiza baza de date pentru a vedea dacă apare noua variabilă care conţine rezultatele subiecţilor transformate în note Z. Corelaţia indică existenţa unei legături între variabile. COEFICIENTUL DE CORELAŢIE PEARSON Notele Z fac posibilă analiza legăturii dintre două variabile. Subiectul al doilea are un nivel normal al anxietăţii. rezultatul fiind aproape cu o unitate mai mic decât media. Prin transformarea notelor brute obţinute de subiecţi la cele două variabile putem să identificăm dacă exista sau nu o legătură între aceste două variabile. Se observă apariţia unei noi variabile.98 pentru o valoare brută de 102. Corelaţia este o metodă statistică descriptivă.4. iar cea mai mică valoare la anxietate a obţinut-o subiectul 8. Scorul primului subiect este atipic.+1). legătură care poate fi pozitivă (când scorurile slabe la prima variabilă se asociază cu scoruri slabe la a doua variabilă. întrucât ea descrie ce se petrece într-un grup de rezultate (r=( ∑( Z1 * Z 2) / N ). pe ultima coloană. De exemplu. nivelul anxietăţii acestuia fiind de 2 ori şi jumătate mai mare decât media. Se constată că cel mai mare scor z este 2. dar plasându-se în limita (–1 . care are un scor z–0. scorurile medii la prima variabilă se asociază cu scoruri medii la a doua variabilă şi scorurile mari la 266 . putem analiza legătura dintre nivelul stresului unui manager şi numărul de subordonaţi. Rezultatele obţinute în urma comenzii DESCRIPTIVES sunt mai sumare şi prezentate într-un singur tabel. ceea ce semnifică faptul că subiectul are un nivel ridicat al anxietăţii raportat la ceilalţi subiecţi. Putem analiza rezultatele obţinute. II.LOREDANA GHERASIM analiza statistică.6 care corespunde unui scor standard 124 obţinută de subiectul 15.

Acest coeficient poate lua valori de la -1 la +1. vom considera un test statistic ca fiind semnificativ dacă pragul de semnificaţie este mai mic sau cel mult egal cu valoarea 0. Ipotezele direcţionale sunt cele în care se precizează tipul de modificare.010 (prag de eroare de 1%). În psihologie se lucrează cu două modalităţi de formulare a ipotezelor (non-direcţionale sau direcţional). prezentate în tabelul de mai jos: Evenimentul Apare Nu apare Predicţia Apare Corect Eroarea I Evenimentului Nu apare Eroarea II Corect Sunt două situaţii în care se poate greşi: când afirmăm că un eveniment se va produce şi în realitate acesta nu va apărea (eroare de tip I) sau când afirmăm că un eveniment nu se va produce şi aceste va apare (Eroare de tip II). Pentru aceste ipoteze probabilitatea de eroare se stabileşte la una dintre extremităţile distribuţiei. iar situaţia II corespunde ignoranţei. ne interesează să ştim în ce măsură rezultatele se datorează întâmplării. Analiza corelaţiei dintre două variabile nu permite stabilirea relaţiei de cauzalitate între aceste variabile. p. Mai precis. fie y poate fi cauză pentru x. În cazul nostru ipoteza ar putea fi formulată non-direcţional astfel: există o legătură între salariul iniţial şi final al subiecţilor.ANALIZA COMPUTERIZATĂ A DATELOR prima variabilă se asociază cu scoruri mari la a doua variabilă).01 (1% eroare) şi pragul de 0. negativă (când scorurile slabe la prima variabilă se asociază cu scoruri mari la a doua variabilă. indică în ce măsură ne înşelăm atunci când afirmăm ceva. pragul de semnificaţie. Testul de semnificaţie pentru verificarea acestui tip de ipoteză este TWO-TAILED. În testarea acestor ipoteze probabilitatea de eroare de 1% sau 5% se împarte la cele extremităţi (cozi) ale distribuţiei scorurilor.050). alegem pragul de semnificaţie de 0. În concluzie. cercetătorul se aşteaptă la un anumit rezultat.050. Ipotezele non-direcţionale sunt cele în care nu se precizează tipul de relaţie dintre variabile. atunci se preferă pragul de eroare de 5% (deci un p=0. Dacă dorim însă să avem mai multe şanse în a demonstra ceva şi consecinţele nu sunt grave în caz de greşeală. Testul de semnificaţie pentru verificarea acestui tip de ipoteză este ONE-TAILED. indică dacă există o legătură între două sau mai multe variabile. fie a apărut a o treia variabilă care a determinat apariţia simultană a celor doua variabile. după analiza rezultatelor corelaţiei ne interesează să vedem dacă legătura găsită (la un grup de oameni) poate fi extinsă la întreaga populaţie. Astfel. Ipoteza din exemplul nostru ar putea fi formulată direcţional. Pragul de semnificaţie. corelaţia pozitivă poate lua valori de la 0 la 1. Pragul de semnificaţie (p) În psihologie este necesară generalizarea concluziile studiilor. Dacă vrem să evităm primul tip de greşeală care are consecinţe mai grave (de a demonstra ceva ce nu există în realitate). Situaţia I corespunde minciunii. iar corelaţia negativă poate lua valori la de -1 la 0. Coeficientul de corelaţie (r) indică gradul în care apare paternul unei relaţii între cele două variabile. Bineînţeles că între variabile poate să nu apară nici o legătură. În general.05 (5% eroare). 267 . În cercetarea ştiinţifică se lucrează de obicei cu două praguri de semnificaţie. În cazul corelaţiei. corespunzătoare procentajului de eroare: pragul de 0. Există trei modalităţi de interpretare a unui coeficient de corelaţie obţinut între două variabile (x şi y): fie x poate fi cauză pentru y. când se fac predicţii pot să apară patru situaţii. scorurile medii la prima variabilă se asociază cu scoruri medii la a doua variabilă şi scorurile mari la prima variabilă se asociază cu scoruri mici la a doua variabilă).

582. 206. 403. 954. 245 • sal_fin: 201. 2. 654. aceste variabile au următoarele valori: • studii:1. 274. 220. 1. 3. 445. 258. care va cuprinde 3 variabile: STUDII (nivelul de studii al subiecţilor) cu trei valori 1 (studii generale). 199 Pentru calculul corelaţiei se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE: Activarea comenzii va deschide următoarea fereastră: 1 2 3 4 5 5 Elementele principale ale ferestrei sunt: 1. 301. 203. 210. 3. 168. 201. 214. 2. câmpul de analiză. 1. 201. Sal_in (salariul iniţial al subiecţilor) şi sal_fin (salariul final al subiecţilor). 2 (studii medii) şi 3 (studii superioare). 298. 1. calculatorul afişând corelaţiile între variabilele luate două câte două. 221. 185.sav”. 197. 3 • sal_in: 189. 1. 268 . 205. 168. coeficienţii KENDALL şi SPEARMAN se folosesc pentru date categoriale şi ordinale. 280. 2. 301. 305. 332. 1. Calcularea corelaţiei Pearson cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza2. 502. în câmpul CORRELATION COEFFICIENTS se alege tipul de corelaţie: coeficientul Pearson se foloseşte pentru date parametrice (variabile cantitative şi continui). 1. 2. 2. 156. 401. 3. 175. 392. 2. 425. 3. 205. 260. 2. cu cât salariul iniţial este mai mare cu atât şi salariul final va fi mai mare. 185. unde se introduc variabilele ce vor fi analizate. 3. 3. se pot introduce mai multe variabile. 2. 1. 198.LOREDANA GHERASIM astfel: legătura dintre salariul iniţial şi final este pozitivă. 341. 3. 298. 178. 625. 542. 2. 725. câmpul care prezintă lista variabilelor din baza de date. 3. 220. 214.

la fel ca şi celelalte opţiuni test de semnificaţie TWO-TAILED şi marcarea cu asterisc a corelaţiilor semnificative FLAG SIGNIFICANCE CORRELATIONS. prin excluderea din analiză a perechilor de rezultate în care avem doar una dintre valori (EXCLUDE CASES PAIRWISE) sau de a exclude din analiză un rând întreg dacă doar una dintre valori lipseşte (EXCLUDE CASES LISTWISE). opţiunea FLAG SIGNIFICANCE CORRELATIONS are ca efect apariţia unui asterisc (*) în dreptul corelaţiilor semnificative. Pentru baza de date creată vom analiza legătura dintre variabilele salariu iniţial şi final al subiecţilor. Aceasta permite realizarea unei analize descriptive a datelor (STATISTICS) şi precizarea modalităţii de tratament a datelor lipsă MISSING VALUES. de obicei se foloseşte pragul TWO-TAILED în testarea ipotezelor de cercetare cu ajutorul SPSS. 5. butonul OPTIONS este urmat de apariţia unei casete de dialog. în foaia OUTPUT sunt afişate următoarele rezultate: 269 . câmpul TEST OF SEGNIFICANCE permite selectarea modului de testate a ipotezei (TWOTAILED sau ONE-TAILED). Se recomandă utilizarea primei variante selectată implicit. Coeficientul de corelaţie Pearson este selectat implicit de către calculator. După activarea butonului OK. 6. Vom introduce variabilele SAL_INI şi SAL_FIN în câmpul din dreapta.ANALIZA COMPUTERIZATĂ A DATELOR 4.

că legătura este slabă dacă valoarea absolută a lui r nu depăşeşte 0.LOREDANA GHERASIM 2 4 1 3 5 Se observă că cele două variabile apar pe coloane da şi pe linii. legăturile puternice având o mărime absolută mai 270 .001 (pragul de semnificaţie). Rezultatele sunt identice deoarece corelaţie este bidirecţională (corelaţia dintre variabilele A şi B este acelaşi lucru cu cea dintre variabilele B şi A). În celula din dreapta sus apare coeficientul de corelaţie dintre salariul iniţial şi salariul final (ANX1 şi ANX2). p<0. Acelaşi rezultate apar şi în celula din stânga jos care prezintă coeficientul de corelaţie dintre salariul final şi salariul iniţial (ANX2 şi ANX1). Prima celulă din stânga (notată cu 4) prezintă coeficientul de corelaţie între variabila salariul iniţial şi salariul iniţial (ANX1 şi ANX1). dar lipsită de semnificaţie (nu apare nici un prag de semnificaţie). N=24 (numărul de subiecţi). legătura este medie la o valoare a lui r cuprinsă între 0.0).81 (coeficientul de corelaţie). ceea ce înseamnă că un salar iniţial mic se asociază.SIG. Vom extrage datele pentru legătura dintre salariul iniţial şi salariul final al subiecţilor: Interpretarea corelaţiei: r=0. La fel nu se analizează corelaţia dintre variabila salariul final şi salariul final (ANX2 şi ANX2).50.PEARSON CORRELATION se găsesc valorile coeficienţilor de corelaţie dintre două variabile Pe rândul 2 . În consecinţă rezultatul poate fi extras din oricare din cele două celule. un salar iniţial mediu se asociază cu un salar final mediu şi un salar mare iniţial se asociază cu salariu mare final. Sunt mai multe elemente de care trebuie să se ţină seama în interpretarea corelaţiei: • semnul corelaţiei: arată natura legăturii care există pozitive (dacă semnul este pozitiv) sau negative (dacă semnul este negativ). Pe rândul 1 . (2-TAILED) apare probabilitatea de eroare la respingerea ipotezei de nul şi acceptare a ipotezei de cercetare Rândul 3 . cu un salariu tot mic. • mărimea absolută a coeficientului: descrie tăria legăturii care apare între variabile. după cinci ani. În cazul nostru.30. semnul este pozitiv.N conţine numărul de subiecţi care au scoruri la ambele variabile În tabel apare legătura dintre fiecare variabilă şi ea însăşi (ANX1 şi ANX1 şi respectiv între ANX2 şi ANX2) dar şi legătura dintre cele două variabile (între ANX1 şi ANX2 dar şi între ANX2 şi ANX1).30-0. semnificaţia acestuia şi numărul de perechi de scoruri. Acest coeficient de corelaţie nu aduce nici un fel de informaţie şi în consecinţă nu se analizează. Se consideră. Între o variabilă şi ea însăşi apare o corelaţie perfect pozitivă (r=1. astfel.

• proporţia de varianţă.001. Pentru a selecta numai subiecţii care au studii generale. fiind codificaţi cu 1 în baza de date. pragul de semnificaţie fiind mai mic de 0. se foloseşte comanda SELECT CASES din meniul DATA.81. Pe noi ne interesează opţiunea IF CONDITION IS SATISFIED.65 (r=0. atunci putem considera că există o relaţie între variabilele studiate. Subiecţii sunt împărţiţi în grupe în funcţie de nivelul de studii (studii). vrem să vedem dacă legătura dintre salariul iniţial şi salariul final are aceeaşi valoare la subiecţii care au studii generale. În aceste situaţii se raportează un p<0. Pentru exemplu nostru proporţia de varianţă are valoarea 0. În dreapta ferestrei apar mai multe opţiuni. Coeficientul de corelaţie ridicat la pătrat ne indică proporţia de varianţă explicată de relaţia găsită. Putem spune că există o legătură semnificativă între nivelul iniţial şi final al salariului subiecţilor.05. deoarece vrem să selectăm numai cazurile care îndeplinesc o anumită condiţie (să aibă valoarea 1 la variabila studii adică să fie numai subiecţi cu studii generale). Spre exemplu. deci relaţia găsită este prezentă la 65% dintre subiecţi.05. Se observă că abia 65% din variaţia observată se întâlneşte în realitate. În exemplu nostru. pentru a arăta că probabilitatea de a greşi este mai mică decât 0. pentru ca ea să fie completă. Comanda SELECT CASES Uneori este necesară selectarea anumitor cazuri din populaţie pentru a face o prelucrare statistică. Activarea meniului este urmată de apariţia următoarei ferestre: În câmpul din stânga al ferestrei sunt prezentate toate variabilele din baza de date.65).81) coeficientul având valoare mi mare de 0.50 • pragul de semnificaţie dacă este mai mic de 0. care deschide următoarea casetă de dialog: 271 .50. valoarea este 0.1% (calculatorul ne afişează doar primele trei zecimale). În exemplul nostru.ANALIZA COMPUTERIZATĂ A DATELOR mare de 0. Proporţia de varianţă indică la ce procent din populaţia generală apare relaţia. Toate aceste elemente trebuie să apară în interpretare. tăria legăturii este ridicată (r=0. Această opţiune se alege cu un simplu click stânga al mouse-ului: Se activează butonul IF. deci r2=0.000.

cum se poate observa şi în imaginea de mai jos: 272 . Se poate folosi tastatura sau se pot activa butoanele cu cifre şi semne ce se găsesc sub acest câmp. baza de date modificându-se. Condiţia va arăta astfel: Se apasă apoi butonul CONTINUE pentru a salva condiţia: Se activează butonul OK. În cazul nostru se selectează variabila STUDII şi se trece în câmpul din dreapta: Se adăugă condiţia.LOREDANA GHERASIM Se selectează variabila în funcţie de cre se face selecţia şi se trece în câmpul dintre dreapta sus. Pentru exemplul nostru. variabila Studii trebuie să aibă numai valoarea 1 (STUDII=1).

• mărimea absolută a coeficientului: puterea legăturii dintre cele două variabile este ridicată. salariul iniţial mare se asociază cu un salar final mare. care indică rezultatul selecţiei. În partea din dreaptajos a ecranului apare anunţul FILTER ON. Cazurile neselectate sunt “tăiate”. legătura este direct proporţională. valoarea lui r depăşeşte valoarea de 0. După selecţie trebuie făcută prelucrarea statistică a datelor. Numărul de subiecţi din analiză influenţează valoarea pragului de semnificaţie al corelaţiei dar nu şi puterea legăturii dintre variabile. intitulată FILTER_$. deci relaţia găsită apare la 47% dintre subiecţii cu studii generale.47. 273 . deci nu există o legătură semnificativă între salariul iniţial şi final al subiecţilor care au studii generale.69. p=0. care avertizează utilizatorul cu privire la activarea unei comanzi de selecţie Atenţie! Selectarea datelor nu implică şi efectuarea analizei statistice. • proporţia de varianţă explicată de relaţia este r2=0. Explicaţia lipsei de semnificaţie a corelaţiei dintre cele două variabile (în condiţiile în care coeficientul de corelaţie are valoare ridicată) este numărul mic de subiecţi.050. În continuare vom interpreta aceste rezultate: • semnul corelaţiei: corelaţie pozitivă. Se obţine următorul tabel în fereastra cu rezultate: Rezultatul obţinut este următorul: r=0. adică ele vor fi ignorate de la analiză.50.056.ANALIZA COMPUTERIZATĂ A DATELOR La sfârşitul bazei de date apare o nouă variabilă. În cazul subiecţilor cu studii generale se constată că nivelul mic al salariului iniţial se asociază cu un nivel mic al salariului final. • pragul de semnificaţie: valoarea pragului de semnificaţie este mai mare de 0. În cazul nostru trebuie utilizată comanda de analiză a corelaţiei dintre salariul iniţial şi cel final. salariul iniţial mediu se asociază cu un salar final mediu.

în partea dreaptă-jos a bazei de date apare anunţul SPLIT FILE ON. în fişierul OUTPUT. se deschide din nou în meniul iniţial DATA . astfel. În partea de jos a ferestrei se găseşte buton RESET. Comanda SPLIT FILE Uneori însă dorim să vedem ce se întâmplă pentru fiecare subgrup de subiecţi în parte. cu ajutorul săgeţii. comanda de filtrare a datelor dispare. care avertizează utilizatorii că baza de date este împărţită în funcţie de condiţiile (nivelurile) variabilei de grupare . Se activează apoi butonul OK. pentru fiecare condiţie a variabilei independente: studii generale. Rezultatele analizei statistice sunt prezentate separat.LOREDANA GHERASIM După folosirea acestui “filtru” este indicată dezactivarea. La fel ca şi în cazul comenzii SELECT CASES. Pentru a nu repeta comanda SELECT CASES de multe ori se poate utiliza o altă comandă din meniul DATA. De aceea. simpla împărţire a bazei de date nu asigură prelucrarea statistică. vom analiza legătura dintre variabilele salariul iniţial şi salariul final pentru toate categoriile de subiecţi în funcţie de variabila STUDII (nu numai pentru subiecţii cu studii generale dar şi pentru cei cu studii medii şi superioare).sav. trebuie folosită comanda CORRELATIOS pentru a analiza legătura dintre variabilele salariu iniţial şi final al subiecţilor. medii şi superioare: 274 . Activarea comenzii SPLIT FILE deschide următoarea fereastră: Dintre opţiunile din dreapta alegem ORGANIZE OUTPUT BY GROUPS şi apoi. introducem variabila de grupare (STUDII) în câmpul care se activează sub această opţiune: După apăsarea butonului OK. Pentru baza de date BAZA2. Pentru dezactivarea selecţiei. şi anume comanda SPLIT FILE.SELECT CASES.

graficul îl alegem din meniul GRAPHS. deci vom selecta opţiunea SIMPLE. care deschide fereastra: Vom alege un grafic simplu.ANALIZA COMPUTERIZATĂ A DATELOR nivelul de studii al subiecţilor = studii generale nivelul de studii al subiecţilor = studii medii nivelul de studii al subiecţilor = studii superioare Graficul corelaţiei Relaţia dintre două variabile poate fi reprezentată grafic sub forma unui nor de puncte. comanda SCATTER. Se activează apoi butonul DEFINE. care deschide următoarea fereastră: 275 . care să ilustreze relaţia dintre două variabile. Practic.

iar punctele sunt apropiate.81). Reprezentarea grafică a corelaţiei este următoarea: Reprezentarea grafică a corelaţiei apare sub forma unui nor de puncte.LOREDANA GHERASIM Se introduc cele două variabile în câmpurile axei X şi axei Y (nu contează ordinea în care se introduc variabilele deoarece corelaţia este bidirecţională) şi apoi se apasă butonul OK. norul de puncte ar fi fost orientat 276 . Pentru exemplul nostru norul de puncte este ascendent crescător (din stânga-jos spre dreapta-sus) deoarece relaţia dintre variabile este pozitivă. Dacă relaţia ar fi fost invers proporţională. grupate deoarece coeficientul de corelaţie are valoare ridicată (r=0.

Calcularea corelaţiei Kendall cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza3. iar valoarea absolută a coeficientului indică puterea relaţiei. Pentru calculul acestei corelaţii se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE.ANALIZA COMPUTERIZATĂ A DATELOR descrescător (din stânga-sus spre dreapta-jos).sav”. Cu cât valoarea coeficientului este mai mare cu atât relaţia dintre variabile este mai mare. trebuie să folosim coeficientul de corelaţie Kendall's. Din câmpul CORRELATION COEFFICIENTS se bifează coeficientul de corelaţie Kendall's: După confirmarea comenzii în foaia cu rezultate apare următorul tabel: 277 . COEFICIENTUL DE CORELAŢIE KENDALL'S TAU-B Reprezintă o măsură non-parametrică a asocierii variabilelor ordinale sau rangate care presupun cantităţi. apoi se introduc variabilele prof_1 şi prof_2 în câmpul din dreapta.5. Prof_1 (evaluarea interesului elevilor faţă de şcoală de către primul profesorul) şi Prof_2 (evaluarea interesului elevilor faţă de şcoală realizată de al doilea profesor). punctele ar fi fost distribuite uniform pe grafic. În tabelul următor prezentăm valorile acestor variabile. II. semnul coeficientului de corelaţie Kendall's tau-b indică direcţia relaţiei. În cazul în care nu ar fi nici o relaţie. La fel ca şi în cazul corelaţiei Pearson. Pentru a analiza legătura dintre evaluarea făcută de primul profesorul şi evaluarea realizată de al doilea profesor (prof_1 şi prof_2). care va cuprinde 3 variabile: elevi (codul de identificare al elevilor). Acest coeficient de corelaţie poate lua valori doar intre -1 şi 1.

Asocierea nu este însă semnificativă. de la cele mai mici la cele mai mari. Pentru a analiza legătura dintre evaluarea interesului faţă de şcoală al elevilor şi evaluarea relaţiilor cu ceilalţi colegi (eval_i şi eval_re) se foloseşte coeficientul de corelaţie Spearman. Pentru toate cazurile.LOREDANA GHERASIM Se constată că apare o asociere pozitivă între variabile (r=0.60). Calcularea corelaţiei Spearman cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza4. Modalitatea de calcul a corelaţiei Spearman este similară coeficientului Pearson (de fapt de aplică formula coeficientului Pearson). Pentru calculul acestei corelaţii se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE.sav”. Se foloseşte atunci când nu este posibilă măsurarea caracteristicilor analizate ci doar evaluarea lor. Din câmpul CORRELATION COEFFICIENTS se bifează coeficientul de corelaţie Spearman: 278 . p=0.6. al treilea). care va cuprinde 3 variabile: elevi (codul de identificare al elevilor). în asemenea manieră încât indivizii statistici să fie ordonaţi în funcţie de două criterii X şi Y. COEFICIENTUL DE CORELAŢIE SPEARMAN Este o măsurare non-parametrică a corelaţiei dintre două variabile ordinale.091 posibila explicaţie fiind numărul mic de subiecţi din baza de date. II. elevii clasaţi pe primele locuri de către primul profesor ocupă tot o poziţie fruntaşă din perspectiva celui de al doilea profesor. eval_i (evaluarea de către profesori a interesul pentru şcoală) şi eval_re (evaluarea de către profesori a relaţiilor cu ceilalţi elevi). valorile fiecărui tip de variabilă sunt rangate. Această evaluare presupune atribuirea de valori care indică ierarhia subiecţilor (cum ar fi primul. al doilea. Dacă ar fi apărut o asociere negativă dintre variabile (coeficientul de corelaţie ar fi fost negativ) s-ar fi interpretat astfel: elevii plasaţi pe primele locuri de către primul profesor s-ar fi plasat în coada clasamentului din perspectiva celui de al doilea profesor. Acest coeficient de corelaţie mai este denumit şi coeficient de corelaţie a rangurilor. Se introduc variabilele eval_i şi eval_re în câmpul din dreapta.

Deci vom calcula mai întâi valoarea medianei şi apoi vom împărţi subiecţii în grupe în funcţie de valoarea acestui indicator.06. 7.81.91. Inversarea clasamentului nu este semnificativă.88.16.49.10. ceea ce semnifică faptul că elevii plasaţi pe primele locuri ale variabilei interes pentru şcoală ocupă ultimele locuri după cel de al doilea criteriu. 9. 7. II.69.050 (p=0. Împărţirea elevilor în două grupe se realizează în funcţie de mediană. Pentru calculul medianei vom folosi comanda DESCRIPTIV STATISTICS– FREQUENCIES: 279 . pragul de semnificaţie fiind mai mare de 0. 9. corelaţia având semn negativ. 6.81. 6. 8.06.80. RECODIFICAREA ŞI TRANSFORMAREA VARIABILELOR Uneori este necesar ca scorurile brute obţinute de subiecţii unui studiu să fie transformate pentru a putea verifica ipoteza studiului.19. 7. Aplicaţia SPSS are o serie de comenzi care permit transformarea sau recodificarea unei variabile cantitative într-o variabilă calitativă. 8.54 Vom împărţi elevii în două grupe (grupul elevilor cu performanţe bune şi grupul elevilor cu performanţe slabe).86.76. 9.ANALIZA COMPUTERIZATĂ A DATELOR După confirmarea comenzii în foaia cu rezultate apare următorul tabel: Se constată că apare o inversare a clasamentului. 9. 9. 8.78. Pentru a exemplifica utilizarea comenzilor de recodificare vom crea o nouă bază de date (baza5.88. 7.04. 8. acest indicator statistic împărţind şirul de scoruri în două parţi egale (proba medianei).7. relaţii bune cu ceilalţi elevi.73. 8. Valorile variabilei sunt: Media: 8. 6.49. 7.71. 7. 7. 8.06. 7. prin crearea unei noi variabile în baza de date sau modificarea valorilor unei variabile existente în baza de date.03.sav) care conţine mediile obţinute de elevi la sfârşitul anului şcolar.79.260). 7.

95. 4. Subiecţii care au valori mai mici ca mediana (7. câmpul care conţine variabilele din baza de date. Pentru recodificarea variabilei MEDIA se utilizează opţiunea RECODE care se găseşte la meniul TRANSFORM: Comanda RECODE are două opţiuni de recodificare. iar subiecţii care au valori mai mari decât mediana vor forma grupul celor cu performanţe ridicate. în câmpul NAME de la OUT VARIABLE se introduce numele variabilei create. Se poate păstra variabila ce urmează să fie recodificată (INTO SAME VARIABLES) sau se poate crea o nouă variabilă (INTO DIFFERENT VARIABLES).95) vor forma grupul celor cu performanţe scăzute. Noul nume se tastează în câmpul NAME al câmpului OUTPUT VARIABLE: 280 . butonul OLD AND NEW VALUE permite recodificarea variabilei iniţiale 5 butonul IF permite crearea unei noi variabile doar prin selecţia anumitor valori ale variabilei iniţiale Pentru exemplul nostru vom trece variabila pe care dorim să o recodificăm. Se selectează opţiunea INTO DIFFERENT VARIABLES. 2. MEDIA.LOREDANA GHERASIM Pentru exemplul nostru mediana are valoare 7. Comanda RECODE INTO DIFFERENT VARIABLES Selectăm opţiunea de creare a unei noi variabile care să cuprindă grupele obţinute în urma recodificării. 3 în câmpul INPUT VARIABLE →OUTPUT VARIABLE se introduce atât variabila ce urmează să fie recodificată cât şi numele noii variabile. Vom denumi noua variabilă NIVPERF. în câmpul din mijloc al ferestrei cu ajutorul butonului de trecere. ceea ce are ca urmare apariţia următoarei casete de dialog: 3 1 2 5 4 1.

În câmpul NEW VALUE. se activează butonul CHANGE din câmpul OUTPUT VARIABLE: Se activează butonul OLD AND NEW VALUE pentru a defini valorile noii variabile. Cu alte cuvinte această opţiune va însemna că toate valorile variabilei MEDIA mai mici de 7. trebuie ca valorile variabilei MEDIA (variabila iniţială) să le redefinim. în câmpul de lângă opţiunea VALUE. În consecinţă.95).95 vor fi recodificate. Astfel. câmpul OLD VALUE se referă valorile variabilei iniţiale 2. în câmpul OLD→NEW se reunesc opţiunile de recodificarea a variabilelor În exemplul nostru. care va reprezenta valoarea 1 a variabilei NIVPERF (ce va fi creată).95) vor forma grupul subiecţilor cu performanţa scăzută. Activarea acestui buton deschide următoarea casetă de dialog: 2 1 3 Această fereastră prezintă mai multe câmpuri: 1. câmpul NEW VALUE face referire la valorile noii variabile 3. formând o nouă variabilă. LOWEST THROUGH din câmpul OLD VALUE şi vom trece în câmpul activat valoarea medianei (7. subiecţii care au obţinut scoruri mai mici decât mediana (7. prind valoarea în cadrul noii variabile NIVPERF. vom tasta valoarea 1: 281 .ANALIZA COMPUTERIZATĂ A DATELOR Pentru ca noul nume al variabilei să apară în câmpul din mijloc INPUT VARIABLE →OUTPUT VARIABLE şi astfel să aibă loc recodificarea. vom activa opţiunea RANGE.

cu două valori. în câmpul de lângă opţiunea VALUE. Prima treime va alcătui grupul subiecţilor cu performanţă scăzută.95). în câmpul NEW VALUE. Subiecţii cu valori mai mici de 7. mai întâi trebuie să calculăm valorile corespunzătoare percentilelor care împart şirul de scoruri în 3 parţi egale (fiecare parte reprezentând 33. Se foloseşte comanda DESCRIPTIV STATISTICS– FREQUENCIES. cei cu valori cuprinse între 7. iar cei cu medii mai mari de 8.LOREDANA GHERASIM Se apasă apoi butonul ADD al câmpului OLD→NEW. iar ultima treime grupul subiecţilor cu performanţă ridicată. imaginea din stânga. a doua treime grupul subiecţilor cu performanţă medie. cum se poate observa şi în imaginea din mai jos. 282 . Această opţiune va însemna că valorile mai mari de 7. scorurile mai mici de 7. se acţionează din nou butonul ADD din câmpul OLD→NEW. Există posibilitatea de a împărţi valorile unei variabile în mai mult de două grupe. THROUGH HIGHEST din câmpul OLD VALUE şi se trece în câmpul activat valoarea medianei (7. În concluzie.66%). Se observă că în baza de date apare noua variabilă NIVPERF. vom tasta valoarea 2.33% din total).95 ale variabilei MEDIA vor reprezenta valoarea 2 al variabilei NIVPERF. Pentru a putea face împărţirea. iar valorile mai mari de 7.64 vor reprezenta grupului cu performanţa ridicată (grupul 3).64 vor forma grupul subiecţilor cu performanţă de nivel mediu (grupul 2). Pentru exemplificare vom împărţi scorurile la variabila MEDIA în trei parţi egale.95 ale variabilei MEDIA vor primi valoarea 1 în cadrul variabilei NIVPERF. ceea ce duce la modificarea bazei de date. În consecinţă. Se activează apoi butonul CONTINUE şi butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES. Apoi se activează opţiunea RANGE.73 şi 8.73 vor forma grupul celor cu performanţa scăzută (grupul 1). Pentru a fi reţinută şi această a doua condiţie de recodificare. Puteţi verifica dacă recodificarea a fost corect realizată.95 ale variabilei MEDIA vor fi recodificate în variabila NIVPERF primind valoarea 2. Din câmpul PERCENTILE VALUES se bifează opţiunea PERCENTILE şi se introduc centilele care împart şirul de scoruri în 3 parţi egale (adică 33. după cum se poate observa şi în imaginea din dreapta. pentru a putea recodifica următoarele valori.33% şi 66.

ceea ce duce la modificarea bazei de date. scorurile mai mici de 7. Activăm apoi butonul ADD al câmpului OLD→NEW. Valorile variabilei MEDIE cuprinse între 7.INTO DIFFERENT VARIABLES.64 se activează opţiunea RANGE.ANALIZA COMPUTERIZATĂ A DATELOR Pentru a crea această nouă variabilă se activează meniul TRANSFORM – RECODE .73 ale variabilei MEDIA vor forma primul grupului 1. cu excepţia faptului că se păstrează numele iniţial al variabilei recodificate. apoi se activează butonul ADD. În câmpul NEW VALUE se trece valoarea 2.73. În acest exemplu. În câmpul NEW VALUE se trece valoarea 3. Activarea comenzii duce la apariţia casete de dialog: 283 . iar în câmpul NEW VALUE vom trece valoarea 1. Pentru exemplificare vom utiliza aceeaşi bază de date (baza5. cu trei valori.64 vor reprezenta nivelul 2 al variabilei NIVPERF2. cum se poate observa şi în imaginea alăturată: Se observă că în baza de date apare noua variabilă NIVPERF2. Se activează apoi butonul CONTINUE şi butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES. Vom activa opţiunea RANGE. Comanda RECODE INTO SAME VARIABLES Rezultate similare se obţin dacă se utilizează comanda RECODE opţiunea INTO SAME VARIABLES. Se activează apoi butonul ADD al câmpului OLD→NEW. Pentru crearea ultimului grup.sav) şi vom împărţi în două scorurile subiecţilor. pentru a putea introduce următoarea condiţie. Se activează prima opţiune RANGE THROUGH şi se tastează valorile minime şi maxime. cum se poate observa şi în imaginea alăturată. adică nivelul 1 al noii variabile NIVPERF2. care cuprinde valori mai mari de 8. Vom denumi noua variabila NIVPERF2.73 şi 8. tastând noul nume în câmpul NAME al câmpului OUT VARIABLE şi apoi activând butonul CHANGE. THROUGH HIGHEST din câmpul OLD VALUE. LOWEST THROUGH din câmpul OLD VALUE şi vom trece în câmpul activat valoarea 7.

care are aceleaşi opţiuni ca în cazul opţiunii anteriore de transformare într-o variabilă diferită: Recodificare se realiză la fel ca în exemplu anterior. în câmpul din dreapta se introduc variabilele pe care dorim să le recodificăm. În exemplu nostru vrem să recodificăm variabil Media.LOREDANA GHERASIM În câmpul din stânga apar toate variabilele din baza de date. Trecem variabila în câmpul din dreapta: Se activează butonul OLD AND NEW VALUES. când am utilizat opţiunea de recodificare într-o altă variabilă: 284 .

Prezentăm scorurile obţinute de 16 dintre subiecţi. însă. Pentru itemii 1 şi 3 subiecţii au răspuns pe o scală de la 1 (foarte puţin) la 4 (foarte mult). Se constată că s-au modificat valorile variabilei MEDIA. GUV (Câtă încredere aveţi în guvern?).sav) care conţine patru variabile: NRCHEST (codul de identificare). PARLAM (Câtă încredere aveţi în parlament?). aceasta având acum aceleaşi valori ca şi variabila NIVPERF.ANALIZA COMPUTERIZATĂ A DATELOR După confirmarea recodificării să vedem modificările din baza de date. Pentru a vedea atitudinea subiecţilor faţă de instituţiile statului ar trebui să însumăm răspunsurile subiecţilor de la cei 3 itemi. PRES (Câtă încredere aveţi în preşedinte?). Acest lucru demonstrează că cele două opţiuni duc la acelaşi rezultat. Inversarea valorilor variabilelor Comanda de recodificare poate fi utilizată şi pentru recodificarea valorilor scorurilor obţinute la diferiţi itemi. Pentru a putea face 285 . La itemul 2. Pentru a exemplifica utilizarea acestor comenzi de recodificare vom crea o nouă bază de date (baza6. subiecţii au răspuns pe o scală de la 1 (foarte mult) la 4 (foarte puţin).

LOREDANA GHERASIM acest lucru ar trebui ca răspunsurile de la itemul 2 să fie transformate. valoarea 1 a vechii variabile devine 4 pentru noua variabilă. Astfel. valoarea 2 să devină 3. Recodificarea în acest caz presupune inversarea scalei de evaluare pentru itemul 2. pentru ca scala de evaluare să aibă aceeaşi semnificaţie cu a ceilalţi doi itemi (valoarea 1 să însemne foarte puţin iar valoare 4 să însemne foarte mult). Vom redenumi variabila recodificată GUV_R: Vom activa butonul OLD AND NEW VARIABLES. Vom folosi comanda RECODE INTO DIFFERENT VARIABLES pentru a putea verifica dacă recodificarea a fost realizată. adică valoarea 1 a itemului să devină 4 (ceea ce înseamnă foarte mult). deci se tastează 1 în dreptul opţiunii VALUE din câmpul OLD VALUE şi cifra 4 în dreptul opţiunii VALUE din câmpul NEW VALUE. valoarea 3 să devină 2. Apoi se tastează 2 în câmpul de la opţiunea VALUE din câmpul OLD VALUE şi cifra 3 în câmpul de la opţiunea VALUE din câmpul NEW VALUE: La fel se procedează şi pentru celelalte valori care trebuie recodificate. iar valoarea 4 a itemului să devină 1 (ceea ce înseamnă foarte puţin). Pentru recodificare ar putea fi utilizată oricare dintre cele două opţiuni prezentate anterior RECODE INTO SAME VARIABLES sau INTO DIFFERENT VARIABLES. În final trebuie să avem următoarele transformări în câmpul OLD→NEW: 286 . Pentru inversarea scalei de evaluare a itemului vom folosi numai opţiunile VALUE din câmpul OLD VALUE şi NEW VALUE. Se activează butonul ADD din câmpul OLD→NEW.

în câmpul TARGET VARIABLE se tastează numele noii variabile 2.ANALIZA COMPUTERIZATĂ A DATELOR După activarea butonului CONTINUE şi butonului OK al ferestrei principale. opţiunea COMPUTE: 3 1 2 Prezentăm caracteristicile principale ale acestei ferestre: 1. în acest câmp sunt prezentate variabilele din baza de date 287 . trebuie să însumăm scorurile subiecţilor obţinute la cei trei itemi. Pentru a putea face acest lucru se foloseşte meniul TRANSFORM. baza de date va conţine o nouă variabilă (GUV_R) care conţine valorile inversate ale itemului 2: Comanda TRANSFORM COMPUTE Pentru a calcula scorul total la atitudinea faţă de instituţiile statului.

Această nouă variabilă reprezintă atitudinea subiecţilor faţă de instituţiile statului şi reprezintă suma răspunsurilor la cei trei itemi. 288 . Variabile sunt trecute în câmpul NUMERIC EXPRESSION folosind butonul de trecere. în câmpul NUMERIC EXPRESSION se introduce formula de calcul a noii variabile. deci vom tasta numele noii variabile în câmpul TARGET VARIABLE: Apoi vom scrie formula de calcul care va consta în însumarea scorurilor obţinute la cele trei variabile: PRES. dar şi un câmp cu funcţii complexe care pot fi utilizate pentru calculul noilor variabile. sub acest câmp se găsesc butoane cu cifre şi semne. Semnul plus se introduce de la tastatură sau folosind butoanele care se găsesc sub câmpul NUMERIC EXPRESSION: După activarea butonului OK în baza de date apare o nouă variabila. Pentru exemplu nostru vom numi noua variabila ATIT.LOREDANA GHERASIM 3. GUV_R şi PARLAM. cu numele ATIT.

Există trei parametri ai unei distribuţii: modalitatea (indică valorile în jurul cărora se grupează scorurile subiecţilor). înclinarea (indică tendinţa scorurilor de a fi mai mari sau mai mici) şi turtirea (arată cât de mult variază scorurile distribuţiei). În imaginea de mai jos ilustrăm grafic această distribuţie: 34% 14% 2% Scoruri brute Scoruri z 68 -2 84 -1 100 0 34% 14% 2% 116 +1 132 +2 Dacă urmăriţi cu atenţie forma curbei normale veţi constata prezenţa unor „puncte de inflexiune”. mai mici sau mai mari decât două deviaţii standard faţă de medie (adică sub valoarea 68 sau peste valoarea 132). doar aproximativ 2% dintre indivizi vor avea scoruri şi mai extreme. Aproximativ 34% din cazuri se vor afla între medie şi o abatere standard la stânga sau la dreapta mediei. să luăm drept exemplu distribuţia rezultatelor la un test de inteligenţă. Cu alte cuvinte. Întrucât distribuţia normală este simetrică. numai 16% dintre oameni au coeficientul de inteligenţă mai scăzut de 84 sau mai ridicat de 116. iar acest lucru poate fi demonstrat matematic. DISTRIBUŢIA NORMALĂ Variabilitatea rezultatelor urmează reguli care pot fi modelate matematic. Aceste puncte corespund deviaţiilor standard.1. Dacă un fenomen social observat este urmărit o perioadă de timp mai îndelungată. Există o strânsă legătură între scorurile standard (notele z) şi diferite procentaje sau frecvenţe relative. de asemenea. Abia 16% din populaţie vor avea scoruri mai mici sau mai mari de o deviaţie standard. Având o deviaţie standard de 16. curba normală este unimodală. Din perspectiva celor trei parametri. exact 50% din cazuri vor avea scoruri sub valoarea medie. Mai mult. Astfel. Observaţi. simetrică şi mediu turtită. ELEMENTE DE STATISTICĂ INFERENŢIALĂ III. puncte în care linia curbă îşi modifică forma. vom şti că 34% dintre indivizi vor avea scorul cuprins între 100 şi 116 (cei cu IQ situat deasupra mediei) sau între 84 şi 100 (cei cu IQ situat dedesubtul mediei).ANALIZA COMPUTERIZATĂ A DATELOR III. matematicienii au pus la punct formule care permit calcularea diferitelor suprafeţe ale curbei. iar deviaţia standard este 16. că şi mai puţine cazuri sunt mai depărtate de medie. curba normală mai posedă anumite proprietăţi speciale. În plus. Pentru a înţelege mai uşor despre ce este vorba. vom şti că 34% dintre subiecţi au scoruri cuprinse între medie (100) şi o deviaţie standard. Astfel. La acest test media rezultatelor este 100. distribuţia rezultatelor se va face după o curbă normală. Cunoscând nota Z a unui subiect putem şti cu precizie câţi indivizi din populaţie au scoruri mai 289 .

care arată câţi subiecţi au scorurile cuprinse între medie şi nota Z.94% dintre indivizi vor avea scoruri mai mari (50%-44. dar pentru aceasta ei trebuie să demonstreze că într-adevăr vitamina accelerează mersul copiilor.06%) vor avea scoruri mai mici decât subiectul ales de noi.2.06% (50%+44. Orice manual de statistică are la sfârşit un tabel care permite calcularea acestor procentaje cu precizie.56 (după formula: (125-100)/16). ştiind că vârsta la care merg copii prima dată. a început să meargă de la vârsta de 8 luni. în care un grup de farmacişti a sintetizat o vitamină care accelerează procesele de asimilaţie la copii nou-născuţi. aceştia dezvoltându-se mai rapid. Unul dintre efecte este scăderea vârstei la care copii încep să meargă. după administrarea vitaminei. ales aleatoriu din populaţie. Dacă vom consulta unul din tabelele de care aminteam anterior.LOREDANA GHERASIM mici sau mai mari decât al subiectului investigat. Copilul respectiv. În acel tabel. Prezentăm în continuare curba normală corespunzătoare vârstei de debut de la care copiii încep să meargă: 34% 14% 2% 8 luni 11 luni 34% 14% 2% 14 luni 17 luni 20 luni Pentru testarea ipotezei trebuie să parcurgem mai multe etape: Etapa I: Reformularea problemei în termenii populaţiilor de comparaţie.56 valoarea 44. Farmaciştii au primit dreptul să administreze vitamina unui singur copil nou-născut. este precizat un procent. cu o abatere standard de 3 luni? Pentru a răspunde cu dovezi statistice la o astfel de întrebare. vom analiza cel mai simplu test. vom vedea în dreptul lui 1. III. 1995). care are valoarea 1. TESTUL Z Pentru a vedea cum se realizează inferenţa statistică. Farmaciştii au dorit să omologheze vitamina. în care se compară un eşantion format dintr-un singur caz cu o populaţie a cărei parametri sunt cunoscuţi. Astfel. trebuie să facem apel la distribuţia normală a variabilei alese în cadrul populaţiei şi să respectăm anumite etape pentru verificarea raţionamentului. Ca exemplu vom folosi un studiu (Aron & Aron. în exemplul nostru avem de comparat două populaţii: P0 – populaţia copiilor 290 . Deşi avem doar un singur caz pe care trebuie să îl comparăm cu o populaţie ai cărei parametri sunt cunoscuţi. Pot farmaciştii să susţină că vârsta precoce la care a mers copilul se datorează vitaminei. Să presupunem că o persoană obţine la testul de inteligenţă scorul 125.06% dintre subiecţi. pentru fiecare notă Z. Aceasta înseamnă că de la medie (100) şi până la scorul nostru (125) sunt 44.06%) şi 94. în populaţia normală este de 14 luni. ETAPELE TESTĂRII UNEI IPOTEZE.06%. Aceasta arată că doar 5. testul z. ipotezele trebuie reformulate în termenii generali ai populaţiilor de comparat pentru a putea face generalizarea ulterioară. putem calcula nota Z a acestui subiect.

33 pentru că ne referim la scorurile mai mici decât media. Orice ipoteză. Etapa IV: Colectarea datelor şi transformarea lor în scoruri z. una referitoare la scorurile mici (în partea stângă a distribuţiei). Pe noi ne interesează prima dintre aceste valori. copiii din populaţia normală merg la vârsta de 14 luni. Am precizat anterior că fiecărui punct de pe curba de distribuţie normală îi corespunde o anumită notă standard şi o anume distribuţie a cazurilor din populaţie faţă de acel punct. Vom formula două ipoteze: Ipoteza de lucru (experimentală): afirmă că noii născuţi care iau vitamina vor merge mai repede decât cei care nu iau vitamina (H1: P0 < P1) Ipoteza de nul: Este ipoteza care descrie situaţia în care intervenţia noastră (vitamina) nu are nici un efect. Dacă vitamina nu ar avea nici un efect. H0: P0 = P1 Într-o cercetare se testează de fapt ipoteza de nul pentru că ea descrie situaţia deja existentă înainte intervenţiei sau situaţia în care nu am obţine nici un efect. După stabilirea pragului. atunci putem accepta ipoteza de lucru. abia 16% mergând mai târziu de această vârstă.33 2% 8 luni 11 luni 34% 14% 2% 14 luni 17 luni 20 luni 14% Note z -2 -1 0 +1 +2 În tabelele statistice găsim valoarea scorului z (z=2. Vom transforma scorul 291 . trebuie să vedem care este nota Z corespunzătoare acestuia. Pentru această cercetare vom stabili un prag de semnificaţie de 1% întrucât efectele ei sunt importante. 34% -2. care arată cei 1% dintre copii care merg cel mai timpuriu şi o altă valoare referitoare la scorurile mari (în partea dreaptă a distribuţiei) care arată acei 1% dintre copii care merg cel mai târziu. În cazul nostru colectarea datelor înseamnă a observa vârsta la care va merge copilul pentru prima dată (8 luni). Acest prag de semnificaţie arată probabilitatea de eroare cu care noi testăm ipoteza. Există două de valori Z de corespunzătoare pragului 1%. la o valoare Z de 1 (adică 17 luni) se constată că 84% dintre copii merg la vârste mai mici de 17 luni. În cazul nostru ea va fi –2. Pragul de semnificaţie poate fi de 1% (când dorim să fim mai precişi) sau de 5% (atunci când putem fi mai puţin exacţi).populaţia copiilor normali care iau vitaminele. cu o abatere standard de 3 luni. În mod obişnuit.33) corespunzătoare probabilităţii de 1% (numită şi punct de tăiere). aflate în partea stângă a curbei de distribuţie. este testată la un anumit prag de semnificaţie. Dacă ipoteza de nul este respinsă. De exemplu. Această etapă presupune cunoaşterea parametrilor (media şi abaterea standard) populaţiei la care ne raportăm (în cazul nostru distribuţia copiilor care nu iau vitamina). Etapa II: Stabilirea parametrilor populaţiei de comparaţie şi a distribuţiei de comparaţie. Etapa III: Stabilirea pragului de semnificaţie şi a notei z a punctului de „tăiere”. cele două populaţii de copii ar merge la aceeaşi vârstă. Distribuţia acestei variabile este normală. fără nici o altă intervenţie. mai ales în domeniul ştiinţelor sociale.ANALIZA COMPUTERIZATĂ A DATELOR normali care nu iau vitaminele şi P1 .

3.2. acesta trebuie comparat cu scorul Z corespunzător punctului de tăiere. 2.LOREDANA GHERASIM subiectului la variabila vârstă în scor Z.5. acceptăm ipoteza de nul.1. 3. 2.5. 3.3. adică pentru exemplu nostru: Z=(8-14)/3)=-2 Etapa V: Compararea notei z astfel obţinută cu nota z a punctului de tăiere.1. 105. 3. 2. la un prag de probabilitate de 1% că vitamina lor are efectul scontat.9. 1. 55.8. 283. cu valorile: 1europeană. 2. Vom prezenta în continuare. 0. 79. 0. 0. 1. 58. TESTUL T PENTRU COMPARAREA UNUI EŞANTION CU MEDIA POPULAŢIEI Acest test se aplică atunci când dorim să comparăm rezultatele unui eşantion cu media populaţiei (fără să avem informaţii despre varianţa rezultatelor populaţiei).2. 143.8. ind_d (procentul anual de creştere a populaţiei) şi dens (densitatea populaţiei pe km2). 3.8. 1. 2. 1. 1. 1.9 reg: 1. 3.2. 2. nota Z (-2) corespunzătoare scorului brut este mai mare decât a notei Z a punctului de tăiere (–2. 1. 221.5. 2.3. 36. 1. 1. 111.9.7. 2. 1. 1. ind_d: 0. 189. Media eşantionului nostru este mai mare sau mai mică comparativ cu cea a populaţiei cu valoarea 2. 0. 81. 4. Prezentăm în continuare valorile acestor variabile: dens: 94.4. 0. 1.4. farmaciştii nu au reuşit să dovedească.sav).2.5. 124. 40. care conţine trei variabile: regiune (zona geografică. 2.3. 54. -0. 39. 3. 1.6. ipoteza experimentală neconfirmându-se. succint testele de comparaţie cele mai frecvent folosite. În consecinţă. 0.1. prin raportare la distribuţia populaţiei normale de comparat folosind formula notei Z (X-M)/SD).3.1. 1. 1. Ipoteza de cercetare: Indicele demografic al eşantionul nostru va avea o avea o valoare diferită de indicele demografic al populaţiei Ipoteza de nul: indicele demografic al eşantionului va avea aceeaşi valoare cu cel al populaţiei Folosirea SPSS pentru compararea unui eşantion cu media unei populaţii Aplicarea testului t se face activând din meniul ANALYZE-COMPARE MERANS opţiunea ONE SIMPLE T TESTS: 292 .3. 2.3. 29. 1.8. 36. 1. 0. 2.1. 3. După obţinerea scorul Z corespunzător datelor colectate. În cazul nostru. 2. 3. Cu alte cuvinte. 3. 94.3? Deoarece nu avem acces la alţi parametri ai populaţiei. Pentru a vedea cum anume se foloseşte programul SPSS în această situaţie vom crea o nouă bază de date (baza7. Vom aplica testul t pentru a compara un eşantion cu o populaţie la care cunoaştem media. 2 Dorim să comparăm scorurile eşantionului la variabila indice demografic cu media populaţiei.1. 2. 1. 3. 0. 216. III. care are valoarea 2. 0. 2. 0. 2. 51.33). 3.3. 27. 2. 47. 2-asiatică şi 3-africană). 800. În ipoteza noastră experimentală ne aşteptam ca nota Z corespunzătoare scorului brut să fie mai mică decât valoare Z a punctului de tăiere. 63. 2. 2. 2. 188. Am prezentat testul Z pentru a înţelege logica testării ipotezelor şi înţelesul pragului de semnificaţie. 102. 227. 2.5. 80. -0.9.8.4.1. 0. 86. în afară de medie va trebui să estimăm variabilitatea sa. 2. 1. 3. 1.7. 1. 3.3.3.8. 0. 49. 5. 0.1. 3. 87. 330. 102. 3.

3 pentru exemplul nostru). Error Mean . ceea ce implică un prag de semnificaţie de 5%. 2. pe ecran va apare fereastra de OUTPUT: 1 One-Sample Statistics 2 Std. Deviation 1.489 Std.189 N procentul de crestere anuala a populatiei 37 Mean 1.149 3 293 . câmpul cu toate variabilele din baza de date.ANALIZA COMPUTERIZATĂ A DATELOR După activarea acestei comenzi pe ecran apare următoarea fereastră: 1 3 2 Această fereastră are trei elementele importante: 1. câmpul unde vom introduce variabilele pe care vrem să le analizăm 3. După activarea butonului CONTINUE şi apoi a butonului OK al ferestrei principale. Nu vom modifica pragul de semnificaţie. câmpul în care se introduce valoarea medie a populaţiei cu care comparăm eşantionul (cu valoarea 2. Activare butonului OPTIONS duce la deschiderea următoarei ferestre: Se observă că automat calculatorul a ales un interval de încredere (CONFIDENCE INTERVAL) de 95%.

sunt câte elemente pe care de acre trebuie să ţinem seama: • pragul de semnificaţie: care ne indică probabilitatea de eroare atunci când respingem ipoteza de nul.000 Mean Difference -.1% (calculatorul ne afişează doar primele trei zecimale). în cazul nostru df=36 6. Putem afirmă că 294 . conţine date despre testul t propriu-zis. • sensul diferenţei: este dat de valoarea mediilor comparate sau de semnul notei t şi arată în ce sens apare diferenţa (care medie este mai mare).3)/0. Rezultatele pentru exemplul anterior sunt: Mediile: Meş=1.26. în cazul nostru m=1. pragul de semnificaţie trebuie să fie mai mic sau cel mult egal cu 0. în această celulă este afişată media eşantionului. SD=1.49 2.811 4 5 6 7 8 Rezultatele sunt grupate în două tabele. σm=0.3. mai precis deviaţia standard a populaţiei de eşantioane de aceeaşi mărime cu al nostru (37). conţine elemente de statistică descriptivă.29. dar se raportează ca un p<0. Valoarea lui t este obţinută după formula t=(m.1 3. prezintă pragul de semnificaţie real. • gradul de libertate: arată care este mărimea eşantionului pe care s-a făcut testarea ipotezei. celula cuprinde eroarea standard a mediei.05 (adică eroarea nu trebuie să fie mai mare de 5%).000.1 şi -0.001. p<0.19.49-2.LOREDANA GHERASIM One-Sample Test Test Value = 2. oricare ar fi tipul de test ales. cuprinde gradele de liberate pentru care a fost calculată valoarea lui t şi probabilitatea de respingere a ipotezei de nul. 5. prezintă intervalul de încredere al diferenţei dintre cele două medii (-1. celula conţine diferenţa dintre media eşantionului şi cea a populaţie la care ne raportăm. populaţie din care provine eşantionul nostru. care ne spune care este probabilitatea cu care greşim dacă respingem ipoteza de nul şi acceptăm ipoteza de cercetare. 8.4. Al doilea tabel. ONE SAMPLE TEST.µ m )/ σ m =(1. Mpop=2.3 şi abaterea standard (σm) de 0.19≈4. În exemplu nostru valoarea pragului de semnificaţie este 0.4) corespunzător pragului de semnificaţie de 5%.428 t procentul de crestere anuala a populatiei -4. indiferent dacă ele confirmă sau nu ipoteza. Valoarea lui t şi pragul de semnificaţie: t(36)=-4. ONE SAMPLE STATISTICS. nota t a eşantionului nostru comparat la populaţia de eşantioane care are media (µm) 2. în sensul că media eşantionului nostru este semnificativ mai mică comparativ cu cea a populaţie.3 95% Confidence Interval of the Difference Lower Upper -1. (2-tailed) . În continuare vom analiza elementele OUTPUT-ului: 1. 7.19 4. cu atât putem avea mai multă încredere în rezultatele obţinute. Pentru a confirma ipoteze de cercetare.294 df 36 Sig. Cu cât eşantionul este mai mare. în această celulă este afişată abaterea standard a eşantionului. Primul tabel.001. Valoarea nu este identică cu cea din tabel datorită aproximărilor făcute. În interpretarea statistică a notei t. pentru a arăta că probabilitatea de a greşi este mai mică de 0. Aceste rezultate indică faptul că diferenţa dintre medii este semnificativă.195 -.

condiţia de feed-back pozitiv şi respectiv condiţia de feed-back pozitiv. pentru a vedea schimbările care apar ca urmare a intervenţiei terapeutice. Mpop=90 Valoarea lui t şi pragul de semnificaţie: t(36)=1.251 Mean Difference 171.ANALIZA COMPUTERIZATĂ A DATELOR procentul de creştere a populaţie eşantionului nostru este mai mic semnificativ în comparaţie cu cel al populaţiei. Există posibilitatea ca toate nivelurile variabilei independente să fie prezentate aceluiaşi eşantion de subiecţi. III. avem de a face cu grupe independente de subiecţi. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE PERECHI În psihologia experimentală se face distincţie între grupele independente şi dependente de subiecţi. Să analizăm acum dacă scorurile la variabila densitate din eşantionul nostru diferă de cea a populaţiei cu valoarea de 0. fiecărui grup prezentându-i un grad de intensitate al variabilei independente. Subiecţii cărora le măsurăm anxietatea înainte şi după intervenţia terapeutică formează eşantioane perechi. În această situaţie vom avea grupe perechi sau dependente de subiecţi. Error Mean 147. măsurăm nivelul anxietăţii subiecţilor înainte şi după terapie. pozitiv şi negativ. Subiecţii vor fi împărţiţi în două grupe. Cea mai simplă situaţie de comparare a eşantioanelor este în situaţia de test-retest. Fiecare subiect va face parte dintr-un singur grup experimental. p=0.797 Std. Atunci când cercetătorul împarte subiecţii în grupe în funcţie de variabila independentă. cu două grade de intensitate.096 One-Sample Test Test Value = 90 95% Confidence Interval of the Difference Lower Upper -126. (2-tailed) . dacă variabila independentă are două grade de intensitate. Să presupunem că variabila independentă este tipul de feed-back.4. Rezultatele indică faptul că nu există diferenţe semnificative între densitatea medie a eşantionului şi cea a populaţie. Pentru fiecare nivel al variabilei independente vom avea câte un grup de subiecţi. Ceea ce ştim este nivelul anxietăţii subiecţilor care au 295 . subiecţii vor fi împărţiţi în două grupe.251. Deviation 895.7. Rezultatele testului ONE SIMPLE T TEST indică următoarele rezultate: One-Sample Statistics Std. cu valoarea 90 (dacă am accepta ipoteza de cercetare am greşi în 25. Astfel.237 t Numar de oameni/ kilometru patrat 1. în final comparându-se rezultatele subiecţilor.16.167 df 36 Sig.643 470. Nu cunoaştem nivelul mediu anxietăţii populaţie de subiecţi anxioşi înainte de a veni la terapie şi nici nivelul mediu al anxietăţii după terapie. Aceeaşi subiecţi vor trece prin toate condiţiile experimentale.153 N Numar de oameni/ kilometru patrat 37 Mean 261.1% din cazuri). De exemplu. Putem spune că avem densitatea eşantionului studiat de noi este aceeaşi cu cea a populaţiei.797 Mediile: Meş=261.9.

3. Diferenţele dintre mediile celor două eşantioane vor forma un eşantion de comparaţie. variabilele selectate pentru analiză. pentru că avem rezultatele aceloraşi subiecţi înainte şi după terapie. Ipoteza de nul: diferenţele dintre cele două măsurători sunt nule. Aplicarea testului t se face activând din meniul ANALYZE – COMPARE MEANS opţiunea PAIRED-SAMPLES T TEST: Odată activată comanda va apare fereastra de mai jos: 1 2 3 Prezentăm principalele opţiuni ale ferestrei: 1. Ipoteza de cercetare: susţine că vor fi diferenţe între cele două măsurători. Folosirea SPSS pentru compararea a două eşantioane perechi Pentru a demonstra modul de utilizare a testului t pentru eşantioane perechi. pentru acest tip de test se selectează o pereche de variabile. Se utilizează testul t pentru eşantioane perechi. ne aşteptăm ca nivelul anxietăţii după terapie să fie mai mic decât cel iniţial. Ceea ce ne interesează pe noi este de fapt diferenţa dintre cele două măsurători ale anxietăţii.LOREDANA GHERASIM venit la terapie. înainte şi după terapie. Acest eşantion al diferenţelor se compară cu o populaţie la care cunoaştem media (media are valoarea 0 conform ipotezei de nul). nu există nici o diferenţă între nivelul iniţial şi cel final al anxietăţii. câmpul din stânga cuprinde variabilele din baza de date 2. înainte şi după intervenţia terapeutică. vom folosi baza de date Baza1. câmpul în care se introduc cele două variabile pereche După introducerea variabilelor în câmpul de analiză fereastra ar trebui să arate astfel: 296 .sav. indică selecţia curentă.

3 297 . conţine perechea de variabile analizată. pentru fiecare dintre acestea vom analiza celulele. Vom păstra intervalul de încredere de 95%.1. conţine mediile celor două grupe analizate: Mini=107.1865 2 1 Mean Pair 1 nivelul anxietatii inainte de terapie nivelul anxietatii dupa terapie 107.05 anxietatii dupa tera 14 15 Rezultatele sunt organizate în trei tabele.2593 4. Deviation Mean Lower Upper 8. Error Mean Std. Error Mean 1.270 7 10 9 8 Pair 1 Paired Samples Test 11 12 13 Paired Differences 95% Confidence Interval of the Difference Std.95 3. Deviation 6. Tabelul PAIRED SAMPLES STATISTICS: 1.1593 t -. conţine deviaţiile standard a scorurilor fiecărui eşantion: Sini=60. (2-tailed) .9000 107. .nivelul -0. adică să provină de la aceeaşi subiecţi şi fie cuantificate cu aceeaşi unitate de măsură 2. variabilele trebuie să fie perechi. Sfin=5.0111 -4.980 nivelul anxietatii ina de terapie .9940 2. După apăsarea butonului OK fereastra OUTPUT ne va prezenta următoarele rezultate: 3 Paired Samples Statistics 4 Std. N=20 4.3454 1.025 df 19 Sig. prezintă numărul de subiecţi din fiecare eşantion.259 Sig. Mfin=107.0166 5.ANALIZA COMPUTERIZATĂ A DATELOR Butonul OPTIONS este identic cu cel de la testul t care permite compararea unui eşantion cu o populaţie.9.3062 5 6 Paired Samples Correlations N Pair 1 nivelul anxietatii inainte de terapie & nivelul anxietatii dupa terapie 20 Correlation -.9500 N 20 20 Std.

p=0. Avem trei situaţii posibile: • lipsa corelaţiei semnificative: în acest caz nu există o legătură între ierarhia subiecţilor la prima cu cea de al două măsurare.9. df=19 15. adică probabilitatea de eroare dacă am afirma că există o legătură între cele două variabile Tabelul PAIRED SAMPLES TESTS 8. coeficientul de corelaţie dintre cele două variabile pereche 7.95 Valoarea lui t şi a pragului de semnificaţie: t(19)=-0. adică nota t a eşantionului de diferenţe în cadrul populaţiei de eşantioane: t(19)=-0. cuprinde abaterea standard a eşantionului rezultat din diferenţele celor două eşantioane 11. pragul de semnificaţie al corelaţiei. conţine numele perechii de variabile şi precizează diferenţa dintre variabile. Subiecţii au acelaşi nivel al anxietăţii după intervenţia terapeutică. p=0. deoarece diferenţele nu sunt sistematice. Valoarea negativă indică faptul că anxietatea iniţială este mai mică comparativ cu cea finală 10.02 14. nu a îmbunătăţit starea subiecţilor. Putem afirma că diferenţele între măsurători nu sunt sistematice. 298 . astfel că putem spune că terapia nu a avut efect. gradele de libertate pentru care este calculată nota t. conţine abaterile standard ale populaţiilor de eşantioane de N subiecţi din care provin eşantioanele noastre Tabelul PAIRED SAMPLES CORRELATIONS 6. • corelaţie pozitivă semnificativă: indică faptul că ierarhia subiecţilor se păstrează de la o măsurare la alta. În exemplu nostru avem prima situaţie corelaţie nesemnificativă. Cei care aveau rezultate mici la prima măsurare au rezultate mici şi la a doua. ceea ce indică faptul că cele două variabile sunt independente una de cealaltă.980. Cei care aveau rezultate mici la prima măsurare au rezultate mari la a doua. intervenţia acţionând oarecum haotic. valoarea lui t. • corelaţie negativă. iar cei care aveau rezultate mari la prima măsurare au rezultate mici la a doua măsurare.25. În cazul nostru se constată că nu apare o diferenţă semnificativă între nivelul iniţial şi cel final al anxietăţii (dacă am respinge ipoteza de nul am greşi în 98% din cazuri sau cu alte cuvinte valoarea lui t se plasează în zona de încredere a ipotezei de nul). Interpretarea se face în funcţie de valoarea lui t şi pragul de semnificaţie. nu numai nivelul variabilei dependente. semnificativă: indică faptul că ierarhia subiecţilor se inversează de la o măsurare la alta. Corelaţia ne arată dacă subiecţii îşi schimbă ierarhia unii faţă de alţii. r=-0. indică intervalul de încredere de 95%al diferenţei dintre mediile celor două grupe 13.05).LOREDANA GHERASIM 5. cuprinde diferenţa medie dintre cele două grupe de subiecţi. indică abaterea standard a populaţiei de eşantioane care cuprinde toate eşantioanele de aceeaşi mărime 12.02. în cazul nostru anx1-anx2 9.270. Reamintim că pentru a respinge ipoteza de nul trebuie să avem cel mult 5% erori (p≤0. pragul de semnificaţie sau probabilitatea de eroare atunci când respingem ipoteza de nul: p=0. Mfin=107. iar cei care aveau rezultate mari la prima măsurare au rezultate mari şi la a doua măsurare.980 În continuare prezentăm rezultatele obţinute în urma analizei realizată anterior: Mediile iniţiale şi finale ale subiecţilor: Mini=107.

TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE INDEPENDENTE Acest test se foloseşte când dorim să analizăm influenţa unei variabile independente. câmpul în care vom introduce variabila dependentă. 1 . variabila dependentă fiind nivelul iniţial al anxietăţii. adică variabila asupra căreia dorim să analizăm influenţa variabilei independente.ANALIZA COMPUTERIZATĂ A DATELOR III. care presupune eşantioane independente de subiecţi.subiecţi de sex masculin şi 2 – subiecţi de gen feminin).5.sav. În acest caz variabila independentă este genul subiecţilor (cu două grade de intensitate. iar grupul 2 numai din subiecţi de gen feminin). 299 . Vom analiza dacă genul subiecţilor influenţează nivelul iniţial al anxietăţii pacienţilor. câmpul cu variabilele din baza de date 2. În funcţie de variabila independentă se creează două grupe de subiecţi independenţi sau diferiţi (grupul 1 va fi format numai din subiecţii de gen masculin. Pentru a demonstrat modul de utilizare a testului vom folosi datele din baza de date baza1. Fiecare subiect va putea face parte doar dintr-un singur grup. opţiunea INDEPENDENT SAMPLES T TEST: Vom introduce variabila dependentă (nivelul anxietăţii înainte terapiei) în câmpul TEST VARIABLE şi variabila independentă în câmpul GROUPING VARIABLE: 1 2 3 4 Sunt trei câmpurile importante pe care trebuie să le avem în vedere: 1. Folosirea SPSS pentru compararea a două eşantioane independente Aplicarea testului t pentru eşantioane independente se face activând meniul ANALYZE – COMPARE MEANS. Ipoteza de cercetare: subiecţii de sex masculin vor avea un nivel al anxietăţii iniţiale diferit de cel al subiecţilor de gen feminin Ipoteza de nul: subiecţii de gen masculin şi feminin vor avea acelaşi nivel al anxietăţii iniţiale.

LOREDANA GHERASIM

3. câmpul unde introducem variabila independentă sau variabila de grupare (cea după care grupăm subiecţii). 4. butonul care permite precizarea celor două niveluri ale variabilei independente; chiar dacă variabila independentă are mai multe grade de intensitate, se pot preciza doar două dintre acestea. Activarea butonului DEFINE GROUPS deschide o fereastră unde vom trece valorile corespunzătoare celor două grupuri alese pentru comparaţie (în acest caz variabila independentă are doar două niveluri 1 şi 2):

În fereastra OUTPUT sunt prezentate următoarele rezultate: 1 2
Group Statistics

3

4

5

sexul subiectilor nivelul anxietatii subiecti de gen masculin inainte de terapie subiecti de gen feminin

N 9 11

Std. Error Mean Mean Std. Deviation 104,8889 2,5712 ,8571 110,3636 6,9753 2,1031

Independent Samples Test

6

7

Levene's Test for Equality of Variances

t-test for Equality of Means Mean Std. Error Sig. (2-tailed) Difference Difference 18 13,144 ,039 ,031 -5,4747 -5,4747 5% Confidence Interv of the Difference Lower Upper -,3053 -,5739

F nivelul anxietati Equal variance 6,683 inainte de terap assumed Equal variance not assumed

Sig. ,019

t -2,225 -2,411

df

2,4605 -10,6442 2,2711 -10,3756

8

9

10

11

Vom prezenta succint semnificaţia datelor din tabele: 1. celula indică variabila dependentă (nivelul anxietăţii înainte de terapie) care este analizată în funcţie de nivelurile variabilei independente (sexul subiecţilor) 2. indică numărul de subiecţi din fiecare grup independent; în cazul nostru avem 9 subiecţi de sex masculin şi 11 de gen feminin 3. conţine media fiecărui grup independent, se observă că media grupului de subiecţi de gen feminin este mai mare: Mgr1=104,8, Mgr2=110,3 4. conţine deviaţia standard pentru fiecare grup în parte: Sgr1=2,5, Sgr2=6,9

300

ANALIZA COMPUTERIZATĂ A DATELOR

5. precizează deviaţia standard pentru populaţiile de eşantioane de N subiecţi din care provin grupele noastre 6. precizează cele două situaţii posibile în urma testării varianţei populaţiilor: varianţe egale (primul rând) sau varianţe inegale (al doilea rând) 7. arată valoarea testului F, Levene. Înainte de a analiza al doilea tabel, vom preciza faptul că testul LEVENE testează egalitatea varianţelor populaţiilor din care provin eşantioanele noastre. Testul, notat cu F, testează ipoteza de nul care afirmă că varianţele populaţiilor din care provin eşantioanele sunt egale 8. probabilitatea de eroare pentru respingerea ipotezei de nul în cazul testului Levene 9. celula conţine valorile lui t pentru varianţe egale sau inegale ale populaţiilor; semnul lui t ne indică sensul diferenţei dintre medii, fapt de care ne putem da seama uitându-ne la valorile mediilor 10. arată gradele de libertate pentru care a fost calculată semnificaţia notei t; indiferent de rândul pe care îl citim, în funcţie de testul Levene, convenţia este ca să raportăm gradele de libertate de pe primul rând (în cazul nostru df=18) 11. conţine pragul de semnificaţie sau probabilitatea de eroare care apare atunci când respingem ipoteza de nul şi acceptăm ipoteza de cercetare. Pentru a respinge ipoteza de nul pragul de semnificaţie trebuie să fie cel mult egal cu 0,05. Interpretarea rezultatelor obţinute: Mediile: subiecţii de gen masculin - Mgr1=104,8, subiecţi de gen feminin - Mgr2=110,3 Testul Levene are valoarea F=6,6, p=0,019, ceea ce indică faptul că putem respinge ipoteza de nul (care afirmă că varianţele sunt egale). Greşim doar în 1,9% din cazuri dacă respingem ipoteza de nul. Concluzia este că variantele celor două populaţii sunt diferite, vom extrage nota t şi semnificaţia de pe rândul EQUAL VARIANCES NOT ASSUMED. Valoarea lui t şi semnificaţia: t(18)=-2,4, p=0,031. Putem respinge ipoteza de nul, pentru că greşim doar în 3,1% din cazuri şi s acceptăm ipoteza de cercetare. Deci, apar diferenţe semnificative între nivelul anxietăţii iniţiale a subiecţilor de gen masculin şi feminin. Subiecţii de sex masculin au un nivel al anxietăţii semnificativ mai mic comparativ cu a celor de gen feminin. Vom analiza efectul variabilei gen asupra nivelului anxietăţii subiecţilor după terapie. Rezultatele obţinute sunt:
Group Statistics Std. Error Mean 1,3483 1,7805

sexul subiectilor nivelul anxietatii subiecti de gen masculin dupa terapie subiecti de gen feminin

N 9 11

Mean 106,1111 109,4545

Std. Deviation 4,0449 5,9053

Independent Samples Test

Levene's Test for quality of Variance

t-test for Equality of Means 95% Confidence Interval of the Difference Mean Std. Error ig. (2-tailed Difference Difference Lower Upper ,167 -3,3434 ,152 -3,3434 2,3201 -8,2178 1,5309 2,2334 -8,0444 1,3575

F nivelul anxie Equal varian 1,326 dupa terapieassumed Equal varian not assumed

Sig. ,265

t -1,441

df 18

-1,497 17,545

301

LOREDANA GHERASIM

Mediile celor două grupe: Mgr1=106,1, Mgr2=109,4 Testul LEVENE (F=1,3, p=0,256) este nesemnificativ (am greşi în 26,5% din cazuri dacă am respinge ipoteza de nul care afirmă ă varianţele sunt egale). Deci varianţele celor două populaţii sunt egale şi vom extrage rezultatele din primul rând. t(18)=1,44, p=0,167. Valoarea lui t este nesemnificativă (am greşi în 16,7% din cazuri dacă am respinge ipoteza de nul şi am accepta ipoteza de cercetare). Deci nu apar diferenţe semnificative între nivelul anxietăţii bărbaţilor şi femeilor după terapie.

III.6. ANALIZA DE VARIANŢĂ - ANOVA UNIFACTORIAL Se foloseşte atunci când vrem să analizăm efectul unei variabile independente, care are mai mult de două grade de intensitate (sau nivele), asupra variabilei dependente. Pentru a înţelege logica acestei metode să luăm un exemplu. Să presupunem că suntem interesaţi dacă salariul românilor depinde de nivelul de studii (nivel general, mediu şi superior). Mai precis ne aşteptăm ca subiecţii cu studii medii să aibă un salar mai mic comparativ cu cei cu studii, dar să aibă un salariu mai mare comparativ cu cei cu studii generale. Reprezentarea grafică a situaţiei descrisă anterior este prezentată în imaginea de mai jos:

a b

x

M1

M2 MG

M3

Cele trei linii curbe mici descriu distribuţia salariilor pentru cele trei categorii de studii, iar linia curbă mai mare descrie distribuţia salariului pentru toate cele trei niveluri de studii luate la un loc. M1, M2 şi M3 reprezintă salariul mediu pentru fiecare nivel de studii, iar MG este salariul mediu total al tuturor salariaţilor. Distanţa a reprezintă poziţia scorului x faţă de media grupului din care aparţine, iar distanţa b exprimă poziţia scorului x faţă de valoarea medie a populaţiei totale (formată din cele trei niveluri de studii la un loc). Variaţia totală a salariului populaţiei poate fi descompusă în două părţi: o parte din variaţie se datorează abaterilor fiecărui scor de la media grupului din care face parte (distanţa a), iar cealaltă parte din variaţie este produsă de abaterile fiecărui scor de la media totală a populaţiei. Pentru a distinge între grupuri ar trebui ca prima componentă a variaţiei să fie mai mică decât cea de a doua, adică persoanele aflate în acelaşi grup să difere mai puţin între ele şi mai mult de subiecţii din celelalte grupe. Atunci când variaţia intragrup este mai mică decât variaţia intergrup înseamnă grupele sunt diferite.
302

ANALIZA COMPUTERIZATĂ A DATELOR

Analiza de varianţă (simbolul este F, coeficientul Fisher), calculează raportul între variaţia provocată de diferenţele întergrupuri, MSB, şi variaţia cauzată de diferenţele intragrup, MSW, (formula de calcul este F=MSB/MSW) şi stabileşte dacă acest raport este suficient de mare pentru a putea distinge între grupe. Semnificaţia coeficientului F se stabileşte în funcţie de două grade de libertate: gradele de libertate intergrup (valoare dată de numărul de grupuri minus 1) şi gradele de liberate intragrup (valoare dată de suma gradelor de libertate a grupurilor sau de numărul total de subiecţi mai puţin numărul grupurilor). Folosirea SPSS - ANOVA unifactorial Vom folosi baza de date Baza7.sav şi vom analiza efectul variabilei regiune (care are trei grade de intensitate: 1-europeană, 2-asiatică şi 3-africană) asupra indicelui de creştere al populaţie. Ipoteza de cercetare: variabila regiune influenţează valoarea densităţii populaţie sau indicele de creştere va varia în funcţie de regiune. Ipoteza de nul: indicele de creştere (densitatea) va avea aceeaşi valoare, indiferent de zona geografică. Pentru realizarea acestei analize se deschide meniul ANALYZE – COMPARE MEANS, opţiunea ONE WAY ANOVA:

Vom introduce variabila dependentă (procentul de creştere al populaţie) în câmpul DEPENDENT LIST şi variabila independentă în câmpul FACTOR:

2 1 3

4

6 5

Să analizăm fereastra: 1. câmpul în care sunt afişate variabilele din baza de date; 2. câmpul în care sunt introduse variabilele dependente (în cazul nostru densitatea); 3. este câmpul în care se introduce variabila independentă sau factor (în exemplul nostru factorul este regiunea);
303

6.724 2. După activarea butonului OK al ferestrei principale în foia cu rezultate apr următoarele tabele: Descriptives procentul de crestere anuala a populatiei N europa asia africa Total 15 11 11 37 Mean .433 1. Activarea butonului descriptiv deschide următoarea casetă: Opţiunile pe care le vom bifa sunt DESCRIPTIV pentru a vedea mediile celor trei grupe şi reprezentarea grafică a efectului MEANS PLOT. Vom descrie pe scurt opţiunile butonului POST-HOC: Toate testele de la această opţiune indică dacă diferenţele obţinute pe ansamblu prin analiza testului F se regăsesc şi la nivelul comparaţiilor dintre grupuri luate două câte două.149 304 .489 Std.LOREDANA GHERASIM 4. butonul POST HOC permite alegerea unui anumit tip de contrast post-hoc.693 1. butonul CONTRAST permite realizarea unor comparaţii între grupe în funcţie de variabila independentă. Testele sunt prezentate în ordinea descrescătoare a puterii lor.956 .376 . butonul OPTIONS conţine elemente de statistică descriptivă.564 1. Pragurile de semnificaţie a acestor teste sunt ajustate în funcţie de numărul de grupe. Pentru a analiza efectul variabilei independente asupra celei dependente se foloseşte testul BONFERRONI. Deviation . 5.

5.939 . 2. în această coloană sunt prezentate gradele de libertate pentru care se calculează valoarea prag a lui F.421 F 39. gradul de libertate intergrup (sau between) este 2 (3 grupe-1). fără a preciza care sunt grupele între care apar diferenţe semnificative.000 -1.000 -2.939 -.05 level.257 asia . regiunea influenţează valoarea indicelui demografic.630 . conţine semnificaţia testului F sau probabilitatea de eroare când respingem ipoteza de nul.4=39. 9. Din datele pe care le avem până acum.004 . conţine valoarea testului F obţinută prin împărţirea mediei varianţei intragrup la media varianţei intergrup (în exemplul nostru: 16.290* . Coloana este notată cu I.257 asia europa 1.000 . Lower Bound Upper Bound .611 .666 -.666 10 Mean Difference (I) regiunea geografic (J) regiunea geografic (I-J) Std. iar cel intragrup este 34 (numărul total de subiecţi este 37 minus 3 numărul de grupe).259* .303 47. coloana a doua indică nivele variabilei independente care sunt comparate cu nivelurile de referinţă. 8.6/0.642 1.273 .532 Sig. 6. Putem spune că doar pe ansamblu se întâmplă acest lucru pentru că rezultatele analizei ANOVA se referă doar la existenţa diferenţelor globale dintre grupe.277 *. The mean difference is significant at the .ANALIZA COMPUTERIZATĂ A DATELOR 1 2 Sum of Squares 33. prima coloană indică nivelul de referinţă al variabilei independente. 3.564 ANOVA procentul de crestere anuala a populatiei df 2 34 36 Mean Square 16. 5.611 2.5).34)=39. în această coloană sunt prezentate componente ale testului F. faţă de care se face comparaţia. Error europa asia -1.000 Between Groups Within Groups Total 3 4 Multiple Comparisons 5 6 Dependent Variable: procentul de crestere anuala a populatiei Bonferroni 7 8 9 11 95% Confidence Interval Sig.290* . în prima coloană sunt trecute cele două componente ale variaţiei totale: cea intergrup şi intragrup. .277 africa europa 2. Coloana este notată cu J.004 -1.273 1.000 1. p<0. în a doua coloană sunt trecute deviaţiile pătratice care intră în componenţa fiecărui tip de varianţă (intergrup şi intragrup).969* . F(2.908 . 305 .261 14. Vom prezenta succint semnificaţia datelor din tabele: 1.908 -1.642 . putem concluziona că pe ansamblu. coloana afişează valorile diferenţelor dintre coloana I şi J.259* .969* .001.257 africa -2. 4. Pentru a vedea diferenţele dintre grupuri trebuie să analizăm rezultatele prezentate în tabelul POST HOC TESTS: 7.257 africa -.

057 F 2. în exemplul nostru observăm următoarele rezultate: Mgr1(Europa)-Mgr2(Asia)=-1.004 Între toate grupele apa diferenţe semnificative. p<0. p<0.142 Between Groups Within Groups Total 306 .2.001 Mgr1(Europa)-Mgr3(Africa)=-2. steluţa care apare în dreptul diferenţelor dintre medii indică existenţa unor diferenţe semnificative între acestea.072 Sig. În imaginea de mai jos apare grafică a efectului: În continuare vom analiza efectul variabilei regiune asupra densităţii. Astfel.96. 11. Pe ultimul loc se plasează Europa cu cel mai mic (semnificativ mai mic comparativ cu zona asiatică şi africană) indice demografic. coloana conţine valoarea exactă a pragului de semnificaţie pentru fiecare diferenţă. p=0. Rezultatele obţinute sunt următoarele: ANOVA Numar de oameni/ kilometru patrat Sum of Squares 3133461 25709646 28843107 df 2 34 36 Mean Square 1566730. cea mai mare valoarea a indicelui demografic îl are regiunea africană (indicele este semnificativ mai mare comparativ cu celelalte două regiuni). dar mai mici decât cel al regiunii africane). urmează apoi regiunea asiatică (indicele este semnificativ mai mare decât cel al regiunii europene.638 756166.LOREDANA GHERASIM 10. .001 Mgr2(Asia)-Mgr3(Africa)=-0.2.

2.ANALIZA COMPUTERIZATĂ A DATELOR Multiple Comparisons Dependent Variable: Numar de oameni/ kilometru patrat Bonferroni Mean Difference (I-J) -627. 1. 9. 1. 5. 1. 2. 2. 2. 8.000 . 2. 7. 8. 7. 1. 1. 2. 2. 2.186 370. 1.789 345. 10.172 -648. 1. 6. 2. 6. 1.618 -21.nivel scăzut de anxietate scăzut şi 2 nivel ridicat de anxietate). 1. 2. 8. 1. 6. 2.234 . 1. 1.186 345. p=0. 1. 2. 5. 5. 1. 8 Niv_stim: 1.172 627. indiferent de acţiunea celorlalte variabile independente. 2. Prezentăm mai jos datele care trebuie introduse în programul SPSS: Nota: 9. Acest tip de analiză prezintă două tipuri de note F corespunzătoare celor două tipuri de efecte pe care le măsoară. 5.UNIVARIATE Pentru a prezenta modul de folosire al programului SPSS pentru aplicarea acestei metode vom crea o nouă bază de date (baza8.34)=2. 2. Efectele de interacţiune măsoară influenţa combinată a două sau mai multor variabile independente asupra variabilei dependente. 7. 9. 7. Testul POST HOC Bonferroni nu semnalează diferenţe semnificative între cele trei grupe care se formează în funcţie de intensităţile variabilei independente. niv_stim (nivelul stimei de sine.268 1. 8. 1. 1. 2 307 . 1. Logica acestei metode este identică cu a modelului ANOVA unifactorial. 7. 2.nivel scăzut al stimei de sine şi 2 – nivel ridicat al stimei de sine). 10. 9.186 370. Pentru a analiza efectelor mai multor variabile independente se poate folosi analiza de varianţă factorială.1. Deci.618 (I) regiunea geografica europa asia africa (J) regiunea geografica asia africa europa africa europa asia Std. 2. . Constăm nu există un efect al variabilei regiune asupra densităţii populaţiei (nu putem respinge ipoteza de nul pentru că am greşi în 14.2% din cazuri). 1. Error 345. Efectele principale măsoară influenţa unei variabile independente asupra variabilei dependente. 10. niv_anx (nivelul de anxietate cu două valori: 1 . 1. 6. 1. 2.GENERAL LINEAR MODEL .000 . Folosirea SPSS . 2.sav) care conţine trei variabile: nota (notele obţinute de studenţi la examen). la fel coeficientul F măsoară raportul dintre variaţia cauzată de împărţirea pe grupuri şi variaţia intrinsecă a grupurilor. 2. 2. 1. 2. cu două valori: 1 . 1.7. 2. 8. 1. 2.447 21. 2. 8. 8. 1. 2.447 648. 2. 7.142. asiatică sau africană. 1.186 345. III. 1.234 1. 6. ANOVA UNIVARIATE Cele mai multe studii realizate în domeniul psihologiei studiază efectul mai multor factori (variabile independente) asupra uneia sau mai multor variabile dependente.07. 1. 1. 1. densitatea populaţiei este aproximativ aceeaşi indiferent de regiune: europeană.789 Sig.268 Din tabelul ANOVA extragem valoarea şi semnificaţia lui F: F(2. 2 Niv_anx: 1. Metodele prezentate până acum (testele t şi ANOVA unifactorial) permit doar evidenţierea influenţei separate a fiecărui factor. 2. 7.

Vom analiza efectul de interacţiune (sau combinat) al nivelului de anxietate şi al stimei de sine asupra notei obţinute la examen. variabilele independente sunt nivelul stimei de sine (NIV_STIM) şi nivelul anxietăţii (NIV_ANX). fiecare din ele având două grade de intensitate. aici se trec valorile pe care le putem folosi atunci când bănuim că unele variabile independente (factori) ar corela între ele. în câmpul DEPENDENT VARIABLE se introduce variabila dependentă. în câmpul COVARIATE pot fi trecute variabile independente sau variabile dependente care ar putea avea o legătură sau un efect asupra variabilei dependente. Odată activată comanda pe ecran apare următoarea fereastră: 2 3 1 4 5 6 Vom explica această fereastră: 1. în câmpul RANDOM FACTOR pot si trecute variabilele independente. conţine variabilele din baza de date 2. Variabila dependentă este NOTA (vom trece această variabilă în câmpul DEPENDENT VARIABLE: 308 . 6. se poate introduce o singură variabilă dependentă 3. care nu ne interesează în mod direct sau a căror acţiune nu o putem controla 5. deci vom trece aceste variabile în câmpul FIXED FACTORS. astfel vom vedea dacă variabilele noastre independente (trecute în câmpul FIXED FACTORS) influenţează variabila dependentă indiferent de acţiunea factorilor covarianţi. Pentru analiza efectului combinat voma activa meniul ANALYZE .GENERAL LINEAR MODEL opţiunea UNIVARIATE. în câmpul FIXED RACTOR se introduc variabilele independente (sau factorii) a căror efect este controlat (nu este cauzat de întâmplare) 4.LOREDANA GHERASIM În acest exemplu avem două variabile independente niv_stim (nivelul stimei de sine) şi niv_anx (nivelul de anxietate). este o opţiune pentru utilizatorii avansaţi şi nu recomandăm folosirea metodei fără cunoaşterea precisă a semnificaţiei sale. Variabila dependentă este nota obţinută la examen. Pentru exemplul nostru.

Să analizăm fereastra: 1. opţiunea FULL FACTORIAL este marcată implicit.ANALIZA COMPUTERIZATĂ A DATELOR În partea dreaptă fereastra principală există o serie de butoane care conţin opţiuni complexe de analiză. folosind opţiunile care se deschid din câmpul INTERACTION. permiţând calculul anumitor efecte pentru anumiţi factori 3. opţiunea CUSTOM se foloseşte dacă se doreşte simplificarea modelul cu care se lucrează. Precizăm nu vom folosi în analiză toate opţiunile. cu ajutorul butonului cu săgeată se pot selecta factorii pentru care dorim să se calculeze efectele. Pentru modelele simple se recomandată utilizarea acestei opţiuni 2. putem alege efectele pe care vrem să le analizăm. acestea putând fi folosite pentru design-uri experimentale mult mai complexe. Butonul MODEL activează următoarea fereastră: 2 1 3 4 Opţiunile din această fereastră folosesc la construirea unor modele de analiză în condiţiile în care situaţia investigată este complicată (conţine multe variabile independente). ceea ce înseamnă că se vor lua în calcul toate efectele principale şi combinaţiile posibile de factori. bifarea acestei opţiune activează automat câmpurile şi butoanele care se găsesc dedesubt. 309 .

Prin tipul de contrast DIFFERENCE. 310 . vom păstra opţiunea marcată implicită FULL FACTORIAL. Aici sunt trecute doar variabilele independente. Pentru exemplul nostru. permite alegerea tipului de interacţiune dintre variabilele independente (cât de complexă să fie interacţiunea) şi calculul unor coeficienţi de regresie ai modelului (există o legătură strânsă între Regresia liniară şi analiza de varianţă). La fel se procedează şi pentru variabila independentă nivelul anxietăţii. După alegerea tipului de contrast trebuie activat butonul CHANGE. Cu alte cuvinte vom vedea dacă cei cu stimă de sine ridicată obţin note diferite de cei cu stimă de sine scăzută). se alege tipul de contrast din câmpul CONTRAST. Apoi. se cere programului să analizeze dacă între cele două nivele ale variabilei nivel al stimei de sine vor apărea diferenţe în ceea ce priveşte notele obţinute. Se recomandă tipul de contrast DIFFERENCE.LOREDANA GHERASIM 4. Butonul CONTRAST deschide următoarea fereastră: Opţiunile acestei ferestre permit compararea diferitelor grupuri rezultate din împărţirea subiecţilor în funcţie de valorile sau categoriile variabilelor independente. Se alege variabila independentă pentru care se doreşte calculul contrastul (diferenţa dintre nivelele sale de variaţie). Se apasă butonul CONTINUE pentru a reveni la fereastra principală. am ales variabila NIV_STIM (nivelul stimei de sine). Pentru exemplificare.

ca în imaginea de mai jos: 311 .ANALIZA COMPUTERIZATĂ A DATELOR Butonul PLOTS activează o fereastră dedicată reprezentărilor grafice: Pe axa HORIZONTAL AXIS se introduce variabila independentă ale cărei categorii dorim să le reprezentăm pe axa X. NIV_ANX (reprezentată prin linii separate). În consecinţă vom reprezenta notele la examen în funcţie de nivelul stimei de sine. Pe axa SEPARATE LINES se introduce variabila pentru care se vor trasa linii ce vor reprezenta categorii diferite ale factorului. În exemplul nostru avem doar doi factori. ceea ce permite obţinerea mai multor grafice. SEPARATE PLOTS se foloseşte introducerea celui de al treilea factor. care indică relaţia dintre variabilele introduse anterior pentru fiecare nivel al factorului trei. NIV_STIM (pe care o vom trece pe axa X) şi nivelul anxietăţii.

Recomandăm folosirea acestor opţiuni doar celor care cunosc regresia. deoarece în urma activării acestuia câmpurile ferestrei se golesc. Butonul OPTIONS activează o fereastră specifică acestei analize de varianţă: 312 . Pentru exemplul nostru nu avem nevoie de comparaţii POST HOC. dar menţionăm că ele facilitează tratarea analizei de variantă ca un model particular de regresie.LOREDANA GHERASIM Se activează butonul ADD. Pentru a analiza diferenţele dintre grupe se foloseşte testul Bonferroni. Acest buton permite realizarea mai multor grafice. Nu vom mai comenta aceste opţiuni. Această opţiune se foloseşte doar când variabile independente au mai mult de două nivele de variaţie. deoarece ambele variabile independente au doar două nivel. Revenim din nou în fereastra principală pentru a activa butonul POST HOC care va deschide fereastra: Acest buton are opţiuni similare cu butonul POST HOC din fereastra ANOVA ONE-WAY. Butonul SAVE activează următoarea fereastră: Opţiunile la care face referire acest buton se referă la o altă metodă statistică numită Regresia liniară. Vom reveni la fereastra principală fără a activa vreo opţiune.

sunt 16 subiecţi în grupul celor cu nivel scăzut al stimei de sine. 313 . Opţiunea OVERALL se referă la media calculată pentru toţi subiecţii. minimul şi maximul). deviaţia standard. De exemplu. Primul tabel precizează numărul de subiecţi pentru fiecare grup obţinut în funcţie de nivelurile fiecărei variabile independente. După selecţia opţiunilor fereastră arată astfel: În continuare vom prezenta foaia cu rezultate. prezintă opţiuni ce permit calcularea mai multor parametri. Dintre toate. permiţând calcularea mediei pentru fiecare grup de subiecţi în parte. ne interesează calculul parametrilor descriptivi (media. Primele elemente ale output-ului se referă la parametrii descriptivi ai modelului. este câmpul în care se trec factorii pentru care dorim să calculăm mediile grupurilor de subiecţi 3. precum şi testele de omogenitate (care trebuie să nu fie semnificative pentru a putea aplica acest model ANOVA). neîmpărţiţi în grupuri 2. prezintă toate combinaţiile de factori pentru care avem grupuri diferite de subiecţi.ANALIZA COMPUTERIZATĂ A DATELOR 2 1 3 Prezentăm elementele principale ale ferestrei: 1.

în foaia de rezultate sunt prezentate elementele cele mai importante ale outputului. Ne interesează numai liniile marcate prin acolade. rezultatele testului F. Mai departe. care trebuie să fie nesemnificativ pentru a utiliza această metodă. Aceste date sunt rezultatul opţiunilor marcate de noi din fereastra butonului OPTIONS.LOREDANA GHERASIM Al doilea tabel precizează mediile totale precum şi cele corespunzătoare fiecărui subgrup de subiecţi. Tabelul cu testul lui Levene reprezintă tocmai testul de omogenitate. 1. 4 2 3 1 Cele mai importante elemente ale tabelului se referă la testul F. arată variabilele ale căror efecte le luăm în calcul: 314 . subgrup determinat de categoriile factorilor din model.

Tabelul alăturat reia analiza contrastelor pentru factorul nivelul anxietăţii: Aici nu mai apar diferenţe semnificative (fapt confirmat şi de lipsa unui efect principal pentru această variabilă).107). conţine gradele de libertate between subjects şi within subjects Pentru exemplu nostru s-a obţinut doar un singur F semnificativ (p<0.30)=2. LEVEL l). Sensul diferenţei (-1.68.001). 3. Restul efectelor sunt nesemnificative. p=0. p=0. deci nota la examen nu este influenţată de efectul combinat al nivelului de anxietate şi al stimei de sine.30)=22.107). Deci apare un efect principal al variabilei nivelul stimei de sine asupra notelor la examen. conţine pragurile de semnificaţie ale testelor F.ANALIZA COMPUTERIZATĂ A DATELOR linia cu NIV_STIM arată efectul principal al factorului nivelul stimei de sine.93) indică faptul că cei cu nivel ridicat al stimei de sine (LEVEL 2) au obţinut note mai semnificativ mai mici comparativ cu cei cu nivel ridicat al stimei de sine (LEVEL 1). 2. deci notele subiecţilor nu depinde de cât de anxioşi sunt aceştia. 4. p=0. Următoarele tabelele prezintă media obţinută pe ansamblu (tabelul l). • linia NIV_STIM*NIV_ANX se referă la efectul de interacţiune al celor două variabile asupra variabilei dependente. Nu apare un efect principal al variabilei nivelul anxietăţii (F(1.7. Aceste tabele ajută la interpretarea sensului diferenţelor la testele de 315 • . Pentru a vedea modul în care nivelul stimei de sine (NIV_STIM) influenţează nota la examen. • NIV_ANX arată efectul principal al factorului nivel de anxietate. Această diferenţă a fost comparată cu situaţia în care cele două grupuri ar fi obţinut valoarea zero (HYPOTHESIZED VALUE). p<0. Pragul de semnificaţie (notat cu SIG) indică apariţia unei diferenţe semnificative.30)=0. mediile obţinute pentru fiecare factor în parte (tabelele 2 şi 3) şi cele pentru grupurile de subiecţi rezultat al combinării nivelurilor celor două variabile independente. deci nivelul anxietăţii nu afectează nota la examen (Mdif=-0.881).13. De asemenea. nu apare un efect de interacţiune al variabilelor independente nivelul stimei de sine şi nivelul anxietăţii (F(1. indiferent de acţiunea celuilalt factor. conţine notele F corespunzătoare efectelor principale şi de interacţiune.05) şi anume cel corespunzător liniei NIV_STIM (F(1. trebuie să ne uităm în tabelul de contrast: Testul de contrast calculează diferenţa între media notelor obţinute de subiecţii cu nivel ridicat al stimei de sine şi a celor cu nivel scăzut al stimei de sine (LEVEL 2 vs.02. indiferent de acţiunea celuilalt factor.

316 . La finalul foii de rezultate apare reprezentarea grafică a interacţiunii dintre variabilele independente: Liniile graficului reprezintă nivelurile diferite de anxietate. Tabelele prezintă şi deviaţiile standard şi limitele valorii medii pentru un interval de încredere de 95%. pentru exemplul nostru. Mai mult. Efectul principal al variabilei NIV_STIM poate fi observat grafic cu uşurinţă: notele obţinute de subiecţii cu stimă de sine ridicată au valoare mai mică comparativ cu cei care au stimă de sine scăzută. nivelul stimei de sine acţionează asupra notei la examen în acelaşi mod indiferent de nivelul anxietăţii. că nota la examen este influenţată de nivelul stimei de sine dar nu şi de nivelul anxietăţii.LOREDANA GHERASIM contrast şi interacţiunii variabilelor. Putem concluziona.

121. 2. 116. 1. Scopul cercetării ar putea fi analiza eficienţei intervenţiilor terapeutice asupra nivelului anxietăţii.sav) care conţine trei variabile: ANX1 (scorurile pacienţilor la scala de anxietate înaintea terapiei.GENERAL LINEAR MODEL – REPETED MEASURES Pentru a prezenta modul de utilizare a programului SPSS pentru aplicarea acestei metode vom crea o nouă bază de date (baza 8. 109. Această variabilă independente se referă la momentul măsurării anxietăţii pacienţilor şi are două niveluri. 103. 105. 124. care trebuie introduse în programul SPSS: ANX1: 109. 109. 106. şi anume modelul ANOVA cu măsurări repetate. în cazul nostru această variabilă este măsurarea repetată a anxietăţii înainte şi după terapie (sau test-retest). 1. 110. 2. 1 – pretest (înainte terapiei) şi 2 posttest (după terapie). cu măsurări repetate. Activarea comenzilor pentru acest model ANOVA se face din meniul ANALYZE . Acest model de analiză de varianţă se utilizează atunci când se doreşte analiza efectului de interacţiune a două variabile independente. se formează o nouă variabilă independentă. Atunci când una dintre variabilele independente presupune eşantioane perechi sau măsurări repetate. iar cealaltă măsurări repetate. 104. Efectele de interacţiune măsoară influenţa combinată a două sau mai multor variabile independente asupra variabilei dependente. 110. Prezentăm mai jos datele. 117. 2. 108.tip 1 de terapie şi 2 . 2. 104. 110. 1. 104. Pentru a analiza efectul terapiei asupra stării pacienţilor trebuie să comparăm nivelul iniţial şi cel final al anxietăţii pacienţilor. ANOVA REPETED MEASURES Modelul ANOVA UNIVARIATE prezentat anterior permite analiza efectului de interacţiune a două variabile independente care presupun grupe independente de subiecţi. 2.tip 2 terapie). Folosirea SPSS . 102.ANALIZA COMPUTERIZATĂ A DATELOR III. Astfel. 1. 103. 103. 110. 112. Variabila independentă tip de terapie (TERAPIE) are două nivele (tip 1 de terapie şi tip 2 terapie) şi presupune eşantioane independente. 104. 105. 2. 1. 1. După activarea comenzii. 102. una presupunând eşantioane independente. 104. 102. 2. 105. 2. indiferent de acţiunea altei variabile independente. 106. 112. 103.8. 1. 2. 110. 115. ANX2 (scorurile pacienţilor la scala de anxietate după terapie). 2. La fel ca şi modelul de varianţă prezentat anterior şi acest tip de analiză prezintă două tipuri de note F corespunzătoare tipurilor de efect măsurate. Efectele principale măsoară influenţa fiecărei variabile independente asupra variabilei dependente. 104.GENERAL LINEAR MODEL opţiunea REPETED MEASURES. trebuie să utilizăm un alt model de analiză de varianţă. şi TERAPIE (tipul de terapie utilizat. cu două valori care corespund celor două tipuri de intervenţii terapeutice 1. 102. 1. În locul denumirii generice a variabilei care presupune măsurări repetate. 115. Cu alte cuvinte trebuie denumită variabila independentă care presupune măsurări repetate şi trebuie precizate nivelurile acesteia. 102. 102. 115. ANX2: 110. care apare în câmpul WITHIN-SUBJECTS FACTOR NAME (factor 1) vom trece numele noii variabile 317 . pe care o vom denumit TRT. TERAPIE: 1. pe ecran apare fereastra alăturată: Pentru a putea face analiza trebuie definită variabila care presupune măsurări repetate. 2 Variabila dependentă este reprezentat de scorurile obţinute la scala de măsurare a anxietăţii înainte şi după terapie.

în consecinţă aceste variabile se introduc în câmpul WITHIN-SUBJECTS VARIABLES (TRT). se introduc variabile independente sau dependente care ar putea avea legătură sau ar influenţa variabila dependentă. este câmpul ce conţine variabilele din baza de date. Variabila tip de terapie (TERAPIE) se introduce în câmpul BETWEEN-SUBJECTS FACTOR. aici se introduc variabilele care reprezintă niveluri ale variabilei independente cu măsurări repetate. 3. În câmpul NUMBER OF LEVEL trebuie trecut numărul de măsurători repetate. această variabilă presupunând grupe independente de subiecţi şi reprezentând variabila factor. care activat deschide o nouă fereastră: 2 1 3 4 Vom prezenta câmpurile acestei ferestre: 1. în acest câmp introducem variabilele independente care presupun eşantioane independente.LOREDANA GHERASIM TRT. Pentru exemplul nostru vom trece valoarea 2 pentru că anxietatea este măsurată înainte şi după terapie (vezi imaginea din dreapta): Se activează butonul ADD. 4. pentru a putea utiliza metoda şi defini variabilele independente (vezi imaginea din stânga): După salvarea definirii factorului cu măsurări repetate se activează butonul DEFINE. 2. 318 . În cazul nostru variabilele ANX1 şi ANX2 reprezintă nivelurile variabilei TRT.

vom păstra opţiunea selectată implicit FULL FACTORIAL. ceea ce va însemna că în foia cu rezultate vor apărea atât efectele principale ale celor două variabile independente cât şi efectul de interacţiune al acestora. Opţiunile sunt similare celor care au apărut în modelul de analiză de varianţă prezentat anterior ANOVA UNIVARIATE. Butonul MODEL activează următoarea fereastră: Opţiunile din această fereastră folosesc la construirea unor modele în condiţiile în care situaţia investigată este prea complicată.ANALIZA COMPUTERIZATĂ A DATELOR În partea de jos a ferestrei principale apar o serie de butoane care conţin opţiuni complexe de analiză. Pentru exemplul nostru. Butonul CONTRAST activează următoarea casetă de dialog: 319 .

LOREDANA GHERASIM Se observă că deja este selectat tipul de contrast pentru variabila independentă care presupune măsurări repetate (TRT Polynomial). De asemenea. Opţiunea se foloseşte atunci când variabile independente au mai mult de două nivele de variaţie. vom reveni la fereastra principală fără a activa vreo opţiune. pentru că variabilele independente au dor două niveluri. Butonul PLOTS activează o fereastră dedicată reprezentărilor grafice. Vom selecta tipul de contrast Difference. Vom reprezenta nivelul anxietăţii pacienţilor în funcţie de tipul terapiei (pe care o vom trece pe axa X) şi momentul evaluării anxietăţii TRT (reprezentată prin linii separate): Se activează apoi butonul ADD pentru ca aplicaţia SPSS să reţină reprezentarea grafică a interacţiunii dintre variabilele independente: Butonul POST HOC deschide următoarea fereastră: Acest buton are opţiuni similare butonului POST HOC din fereastra ANOVA ONE-WAY şi UNIVARIATE. pentru a analiza diferenţele dintre grupe se foloseşte testul Bonferroni. Trebuie să alegem tipul de contrast pentru variabila TERAPIE. În consecinţă. 320 . Pentru exemplul nostru nu avem nevoie de comparaţii POST-HOC. care presupune două niveluri.

Primele elemente ale output-ului se referă la parametrii descriptivi ai modelului. Primul tabel precizează nivelurile (ANX1 şi ANX2) variabilei cu măsurări repetate (TRT). Butonul OPTIONS activează o fereastră specifică analizei de variantă: La OPTIONS avem posibilitatea de a cere calculatorului să ne afişeze mediile grupelor de subiecţi în funcţie de fiecare variabilă independentă. precum şi în funcţie ambele variabile. În continuare vom prezenta foaia cu rezultate. Recomandăm folosirea acestor opţiuni doar celor care cunosc regresia.ANALIZA COMPUTERIZATĂ A DATELOR Butonul SAVE activează următoarea fereastră: La fel ca la ANOVA UNIVARIATE. 321 . butonul se referă la o altă metodă statistică numită Regresia liniară. deci pentru fiecare grup experimental. Al doilea tabel precizează numărul de subiecţi pentru fiecare grup obţinut în funcţie de nivelurile factorului care presupune eşantioane independente: Următorul tabel precizează mediile pentru fiecare subgrup de subiecţi format în funcţie de toate categoriile factorilor din model. facilitând tratarea analizei de variantă ca un model particular de regresie.

pragul de semnificaţie şi gradele de libertate.267. fără a ţine seama de momentul măsurării F(1. p=0. 322 . p=0. pacienţii care au primit tipul 2 de terapie au un nivel al anxietăţii semnificativ mai ridicat comparativ cu pacienţii care au primit terapia de tip 1 (Mdif=4. Faptul că subiecţii au acelaşi nivel al anxietăţii după intervenţia terapeutică indică faptul că terapia utilizată nu a avut efect.18)=13.002).18)=0.050). În primul tabel se constată că nu apare un efect al variabilei TRT (p>0. p=0.002. Astfel.18)=0.940).40. indiferent de tipul de terapie utilizat. p=0. Se constată că apare un efect principal al acestei variabilei independente asupra nivelului anxietăţii pacienţilor după terapie. De asemenea. Pentru a vedea cum influenţează tipul de terapie nivelul anxietăţii pacienţilor vom analiza tabelul Custom Hypothesis.LOREDANA GHERASIM Următoarele două tabele prezintă efectele principale şi de interacţiune ale variabilelor independente. La fel ca şi la modelul de analiză de varianţă anterior se extrag valorile coeficienţilor F. Următorul tabel indică efectul variabilei independente tip de terapie. Deci subiecţii au acelaşi nivel al anxietăţii înainte şi după terapie.006.661). nu apare un efect combinat al variabilelor independente. ceea ce indică faptul că nivelului iniţial al anxietăţii pacienţilor nu diferă de nivelul final al anxietăţii pacienţilor după terapie (F(1.23. TRT*TERAPIE (F(1.

ANALIZA COMPUTERIZATĂ A DATELOR Următoarele tabelele prezintă media obţinută pe ansamblu (tabelul l). Aceste tabele ajută la interpretarea sensului diferenţelor la testele de contrast şi interacţiunii variabilelor. 323 . Tabelele prezintă şi deviaţiile standard şi limitele valorii medii pentru un interval de încredere de 95%. Efectul principal al variabilei TERAPIE poate fi observat grafic cu uşurinţă. mediile obţinute pentru fiecare factor în parte (tabelele 2 şi 3) şi pentru grupele de subiecţi obţinute în urma combinării nivelurilor celor două variabile independente (tabelul 4). La finalul foii de rezultate apare reprezentarea grafică a interacţiunii dintre variabilele independente: Liniile graficului reprezintă momentele măsurării anxietăţii.

prin raportare la o distribuţie teoretică stabilită de cercetător.foarte mulţumit). recomandăm conceperea instrumentelor utilizând scalele de interval în locul celor nominale sau ordinale. 2 . 5-foarte mult". aceste metode pot eşua mai uşor în demonstrarea diferenţele. este mai indicată măsurarea pe o scală de interval de tipul „1-deloc -2-3-4-5 . fără a intra în detaliile teoretice privind aceste teste. acolo unde acestea există în realitate. datele pe care le obţinem folosind aceste scale de măsură nu mai pot fi analizate folosind metodele prezentate anterior. În acest fel. TESTUL CHI PĂTRAT Testul chi-pătrat permite compararea distribuţiei frecvenţelor unei variabile pe mai multe categorii. Metodele statistice utilizate pentru analiza acestor date sunt numite teste neparametrice. cu două valori: 1 . Folosirea SPSS Pentru a demonstrat modul de aplicare a acestei metode vom crea o nouă bază de date (baza9. În consecinţă.deloc mulţumit. 4-mult. pot fi uşor detectate diferenţele folosind metodele parametrice. cu două valori: 1 indicând persoanele care au votat pe Geoană. parametrii obişnuiţi pe care i-am folosit până acum în analiză. IV. în locul măsurării preferinţei pentru un anume tip de muzică folosind o scală ordinală de tipul „1-deloc. DATELE NEPARAMETRICE Datele non-parametrice sunt mai frecvent utilizate în sociologie decât în psihologie.puţin mulţumit şi 3 .LOREDANA GHERASIM IV. De exemplu. deoarece nu există restricţii cu privire la distribuirea normală a rezultatelor. precum media sau abaterea standard. 2-puţin. Deoarece avem de a face cu scale nominale sau ordinale. GEN (genul subiecţilor. Aceste date se analizează pornind de la frecvenţele de apariţie ale diferitelor categorii sau de la probabilităţile de apariţie ale acestor categorii. Vom prezenta câteva dintre metodele neparametrice. Aplicarea acestor teste este mai facilă decât folosirea testelor parametrice. iar 2 indicând pe cei care au votat Băsescu) şi variabila GR_MULT (conţine răspunsurile subiecţilor la întrebarea „Cât de mulţumiţi sunteţi de situaţia actuală a ţării?”. 3-mediu. Totuşi.1.foarte mult". Testul compară abaterile de la această distribuţie teoretică obţinute în realitate şi estimează probabilitatea ca ele să apară aleatoriu.sav) care cuprinde următoarele variabile: VRST (vârsta subiecţilor). Din acest motiv. nu mai pot fi utilizaţi. Prezentăm scorurile subiecţilor la cele patru variabile: 324 . cu două valori: 1 semnifică subiecţi de gen masculin şi 2 subiecţi de gen feminin) şi VOT (cuprinde răspunsurile subiecţilor la întrebarea „Cu cine aţi votat la ultimele alegeri prezidenţiale?.

41. 2. 2. Se observă faptul că în câmpul EXPECTED VALUES este bifată opţiunea ALL CATEGORIES EQUAL. 22. 62. 2. 1. 1. Deci. 27. dorim să vedem cu cine au votat alegătorii din lotul nostru la ultimele alegeri prezidenţiale. 29 GEN: 1. 2.ANALIZA COMPUTERIZATĂ A DATELOR VRST: 45. 2. cea teoretică la care se face raportarea şi abaterile frecvenţei observate de la frecvenţa teoretică (coloana RESIDUALS). 2. 1. 35. 54. frecvenţa observată. 1. vom compara frecvenţa cu care oamenii au votat cei doi candidaţi. 2. 1. atunci foloseam opţiunea VALUES şi butonul ADD. 2. 32. în care categoriile nu s-ar mai fi distribuit egal. 2. 34. 2. 2. 38. 36. 2 VOT: 2. 47. 2. 2. Rezultatele testului apar în foaia cu rezultate sub forma a două tabele: În primul tabel sunt trecute elementele descriptive ale testului. 1. 37. Vom activa fereastra specifică testului din meniul ANALYZE . 1. categoriile sale. 23. ceea ce semnifică faptul că se va compara situaţia reală a votului cu situaţia în care candidaţii ar obţine acelaşi număr de voturi.NONPARAMETRIC TESTS opţiunea CHI-SQUARE: Vom introduce variabila VOT în câmpul pentru analiză (TEST VARIABLES LIST). 2. folosind testul chi pătrat. 3. 1. 2. 1. 2 GR_MULT: 1. 2. 3. 325 . 3. 19. 1. Dacă însă doream să comparăm distribuţia cu o alta. 1. 2. 1 În exemplul nostru. 3. 2. 3. 2. 2. 1. 2. 2. 1. 2. 1. 1. 21. 51. 43. 2. 2. 2.

55 ).018) la un grad de libertate. Folosirea SPSS Pentru a ilustra aplicarea testului vom utiliza baza de date creată anterior (baza9. Deci oamenii au votat în mod semnificativ diferit cei doi candidaţi la preşedinţie. la fel ca şi în cazul testului t. Dintre cele patru tipuri de teste. În foaia cu rezultate apar următoarele tabele: 326 . Testul se activează din meniul ANALYZE . Vom analiza dacă apr diferenţe între subiecţii de gen masculin şi cei de gen feminin în ceea ce priveşte gradul de mulţumire faţă de situaţia actuală a ţării. Semnificativ mai mulţi oameni au votat pe Băsescu ca preşedinte comparativ cu cei care lau votat pe Geoană. vom folosi MANN-WHITNEY U. IV. Toate testele neparametrice ce compară două eşantioane independente au la bază comparaţii ale rangurilor diferitelor intervale observate. care se bazează pe ierarhia rangurilor observaţiilor din cele două grupuri.sav). Grupurile variabilei independente se definesc folosind butonul DEFINE GROUPS. prezentată în tabelul al doilea ( χ 2 = 5. Vom trece variabila dependentă (GR_MULT) în câmpul TEST VARIABLE LIST.LOREDANA GHERASIM Valoarea statistică a testului. ci calitativă şi ordinală.2. este semnificativă (p=0.NON-PARAMETRIC TESTS opţiunea TWO INDEPENDENT SAMPLES: Fereastra care apare pe ecran semănă foarte mult cu cea care apare la activarea testului t pentru eşantioane independente. TWO INDEPENDENT SAMPLES Aceste teste sunt echivalentul testului t pentru eşantioane independente. doar că în acest caz variabila dependentă măsurată nu este cantitativă. iar variabila independentă (GEN) în câmpul GROUPING VARIABLE.

sav) care cuprinde două variabile: ALINATA (cuprinde răspunsurile subiecţilor la itemul „Evaluaţi contribuţia alianţei în integrarea europeană”. pentru cei de gen feminin are valoarea 9. 1. 2.medie şi 3 . SIG). Dacă diferenţele ar fi fost semnificative (p<0. rangul mediu pentru subiecţii de gen masculin are valoare 9. 3. 2. 3. 1. Se foloseşte din meniul NON PARAMETRIC TESTS opţiunea TWO RELATED SAMPLES. 3. 1. Ca şi la acest test. scrisă imediat deasupra valorii pragului de semnificaţie. 2. 1. 3. 1. în primul tabel este prezentată situaţia „descriptivă" (media rangurilor). Prezentăm rezultatele subiecţilor: Alinata: 1. 1.ANALIZA COMPUTERIZATĂ A DATELOR Observaţi că stilul de prezentare al rezultatelor este similar cu cel de la testul chi-pătrat.importanta.050. 1. 2. IV.17. 3. pentru a se activa opţiunile ferestrei. 2. 1. 1.importanta. 2. 3. 1.medie şi 3 . 2. 2. iar valoarea pragului de semnificaţie a testului este dată în tabelul al doilea (linia denumită ASYMP. Astfel. variabila are trei valori 1 . 1. 2 . 2.05). 1. 1. 2. 2. 2 Dorim să vedem dacă subiecţii au o părere mai bună despre unul dintre cele două partide politice. 2. variabila are trei valori 1 . Pentru exemplul nostru vom selecta variabile ALIANTA şi PSD şi le vom trece în câmpul din stânga: 327 . trebuie selectată o pereche de variabile pentru analiză.3. sensul diferenţei ar fi fost dat de semnul notei Z. 2. 3. 1. Pentru a ilustra aplicarea acestui test vom folosi o nouă bază de date (baza10.83. 2. Valoarea pragului de semnificaţie (p=0.778) este mai mare de 0. 2 PSD: 2. 1. 3. 3. 1. 2. 2. Fereastra seamănă cu cea a testului t pentru eşantioane perechi. TWO RELATED SAMPLES Metodele care compară două eşantioane perechi sunt similare aplicării testului t pentru eşantioane perechi. Deoarece subiecţii răspund la ambele întrebări trebuie aplicată o metodă care să permită compararea eşantioanelor perechi. 1. deci putem trage concluzia că femeile şi bărbaţii din studiul nostru nu diferă semnificativ în ceea ce priveşte gradul de mulţumire cu privire la situaţia actuală a ţării. 1. 2. 2 . 1. 1.slabă) şi PSD (cuprinde răspunsurile subiecţilor la itemul „Evaluaţi contribuţia alianţei în integrarea europeană”. 1. 2.slabă).

care se bazează pe rangul valorilor absolute al diferenţelor dintre două variabile. comparând separat diferenţele pozitive şi negative. Prezentarea rezultatelor testului. Din al doilea tabel observăm că testul este nesemnificativ (p=0. se face în două tabele. în foaia cu rezultate. Aceste rezultat indică faptul că oamenii consideră ca ambele partide contribuie la fel de mult la integrarea României în Uniunea Europeană.281). ca mai jos: În primul tabel apare media şi suma rangurilor diferenţelor pozitive şi negative.LOREDANA GHERASIM Vom utiliza testul WILCOXON. unul pentru valorile descriptive şi altul pentru semnificaţia testului. precum şi cazurile în care scorurile sunt la egalitate. Indicii de sub acest tabel arată sensul diferenţelor. 328 .

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->