Aplicaţii SPSS

SPSS prezentare generală
„SPSS for Windows” este un pachet de programe destinat analizei statistice a datelor. Deşi există o varietate de programe de acest gen (SAS, Statistica for Windows, GraphPad, MS Excel, care are şi el funcţii statistice), SPSS se distinge prin structurarea riguroasă şi uşurinţa utilizării, chiar şi pentru începători. Cea mai recentă versiune disponibilă la această dată este SPSS 12.0. Acest manual nu acoperă în mod special o anumită versiune, ci face referire în general la versiunile sub Windows. În esenţă, toate versiunile sub Windows oferă acelaşi pachet de funcţii statistice iar diferenţele, chiar dacă sunt, nu sunt relevante la nivelul unui curs introductiv de statistică.  Simbolul care precede această propoziţie indică introducerea unei informaţii importante, care se impune a fi reţinută.  Ne vom axa pe o prezentare sintetică, axată pe esenţial, considerând cunoscute elementele de bază de operare în mediul Windows.
Funcţii de bază ale SPSS

   

editarea datelor (construirea bazelor de date, transformări ale variabilelor) prelucrarea statistică a datelor (statistici descriptive, teste de semnificaţie) prezentarea rezultatelor, sub formă numerică sau grafică realizarea unor proceduri proprii de prelucrare sau de a modifica procedurile standard SPSS. Această opţiune este rezervată utilizatorilor avansaţi şi nu va face obiectul prezentării în acest manual.

Domeniile de lucru în SPSS Particularitatea principală a interfeţei de lucru cu SPSS este aceea că rezervă fiecăreia dintre funcţiile de mai sus un domeniu special („ecran”, sau „fereastră”). Astfel, la lansarea programului, acesta deschide automat o fereastra rezervată editării datelor (Data Editor) şi una afişării rezultatelor (Viewer). Putem numi aceste ferestre şi domenii de lucru, deoarece la nivelul fiecăruia avem la dispoziţie o varietate de funcţii şi opţiuni specifice. Ca să înţelegem mai bine, trebuie să ne imaginăm „domeniile de lucru” ca fiind „ferestre” distincte, similare celor ale documentelor Word, cu deosebirea că, în acest caz, fiecare fereastra acoperă funcţii specifice. Trecerea de la o fereastră la alta se face într-unul din următoarele moduri:  Din meniul SPSS/Windows, prin alegerea ferestrei dorite;  Utilizând butoanele din bara de comenzi directe a ferestrei SPSS;  Utilizând butoanele de pe bara de sarcini a sistemului de operare (din partea de jos a ecranului).

-2-

Domeniul bazei de date (Data Editor) La lansarea programului SPSS se deschide fereastra domeniului de editare a datelor (SPSS Data Editor). Ea se prezintă ca în imaginea de mai jos, având caracteristicile obişnuite ale unei ferestre Windows, cu o structură de linii şi coloane: - pe coloane sunt variabilele (de ex., cod_sub, rezultat) - pe linii sunt cazurile (în acest caz, cinci subiecţi)

 O sesiune de lucru cu SPSS presupune, în mod necesar, existenţa unei baze de date.  SPSS operează cu o singură bază de date la un moment dat.  Pentru a deschide o altă bază de date, sau a crea una nouă, cea aflată în lucru va fi închisă. Programul solicită salvarea ei prealabilă, dacă acest lucru nu a fost deja efectuat.  Dacă vrem să prelucrăm date aflate în baze de date (fişiere) diferite, este necesară aducerea lor în aceeaşi bază de date (procedura DATA-Merge files, care va fi descrisă mai târziu).  Meniurile ferestrei Data Editor nu se vor activa integral decât atunci când va exista cel puţin o variabilă definită şi valori pentru cel puţin un caz.  Baza de date SPSS poate fi creată direct, cu ajutorul structurii (ferestrei) Data Editor, sau poate fi deschisă cu ajutorul comenzii File-Open, aşa cum vom exemplifica mai târziu. Domeniul afişării rezultatelor (Viwer) SPSS depune rezultatele prelucrărilor într-o secţiune aparte a domeniului de lucru. Aceasta cuprinde toate tipurile de rezultate, atât de tip numeric cât şi de tip grafic. Fereastra respectivă (Viewer) este organizată în două zone distincte: una pentru navigare (în partea stângă) şi alta pentru afişarea rezultatelor (în partea dreaptă).

-3-

în afara operării prin intermediul mediurilor. Imaginea de mai jos redă comenzile SPSS pentru calcularea procedurii de calcul indicatorilor statistici descriptivi. concomitent cu rezultatele. lansare lor în execuţie. Domeniul de editare a procedurilor directe (Syntax) SPSS permite. Aceasta se face în interiorul unei ferestre speciale. (Edit/Options/Viewe/Display commands in the log) -4- .SPO  Un fişier cu rezultate SPSS nu poate fi deschis decât din SPSS  Dacă se doreşte transmiterea rezultatelor în afară SPSS se va proceda fie la „exportul” rezultatelor cu procedura corespunzătoare din meniul File/Export. pe de o parte. şi lucrul direct cu proceduri definite de utilizator. fie la transferarea prin Select/Copy/Paste într-un editor grafic de tipul MS Word. Fişierul rezultat prin salvarea acestei ferestre are extensia . redaţi mai sus. care permite. editarea procedurilor.  Utilizarea directă a procedurilor impune aprofundarea SPSS  Se poate seta afişarea procedurilor curente în SPSS Viewer. iar pe de altă parte. în fereastra SPSS Viewer.

Win 9X) În cazul ferestrei Data Editor. recodificare. inserare. iar de la versiunea 7. cu sau fără liniile despărţitoare ale celulelor. selectare. o procedură de sprijin în alegerea tipului de prelucrare statistică (Statistic Coach) Paşii analizei statistice cu SPSS În principiu. prelucrarea datelor cu SPSS presupune următoarele etape: 1 Introducerea datelor Opţiuni: (a) Introducerea directă a datelor în DATA EDITOR (b) Deschiderea unui fişier de date SPSS (extensia . Fără a intra în amănunte. setează modul de afişare: cu sau fără bara de butoane. adiţionare de fişiere. etc. iată o prezentare succintă a meniurilor pentru fereastra DATA EDITOR: Meniul File Edit View Data Transform Statistics (Analyze) Graph Utilities Window Funcţii principale Operaţii de deschidere şi salvare de fişiere Operaţii de Select/Copy/Cut/Paste. Funcţii de modificare a datelor prin calculare. Find şi. Grupează procedurile de calcul statistic Grupează procedurile de reprezentare grafică Informaţii despre variabile.SAV) (c) Importarea unui fişier de format diferit (se alege din -5- . setarea caracteristicilor de lucru ale SPSS (Options-în versiunile pt. ştergere. structurare pe seturi de variabile Lista ferestrelor deschise cu posibilitatea de selecţie Observaţii Importante pentru pregătirea datelor în vederea prelucrării Importante pentru pregătirea datelor în vederea prelucrării Prin opţiunile fiecărei proceduri se pot obţine şi reprezentări grafice specifice Help Informaţii de ajutor Aici se află un tutorial extrem de sugestiv de operare cu SPSS.Meniurile SPSS Meniurile de tip listă se aseamănă cu meniurile altor programe sub Windows. sortare.5 în sus. definire. cel mai important. Funcţii de operare cu variabilele.

Utilizarea lui optimă presupune. transformarea variabilelor prin calcule. declararea valorilor lipsă. Transform) Meniurile Statistics (sau Analyze) şi Graphs În conformitate cu configuraţia casetei de dialog care este afişată la fiecare procedura Se acţionează butonul OK din caseta de dialog a procedurii  Butonul devine activ numai atunci când sunt întrunite condiţiile presupuse de procedura respectivă Rezultatele prelucrărilor sunt afişate într-o fereastră specifică (SPSS Viewer). recodificări. stăpânirea de către operator a cunoştinţelor teoretice de statistică. în mod necesar. în funcţie de versiune. cu funcţiuni de editare grafică sau de tip text. Se editează rezultatele afişate în Viewer. combinarea datelor din două fişiere diferite (meniurile Data. 7 8 Editarea rezultatelor Inserarea datelor întrun document  SPSS este un program puternic de analiză statistică a datelor.2 3 4 5 6 Pregătirea datelor Selectarea procedurii satistice Selectarea variabilelor ce urmează a fi supuse prelucrării Rularea procedurii Analiza rezultatelor caseta File open/File of type) Corecţia erorilor. selecţii.  Aşa cum un program de editare grafică nu compensează lipsa de talent la desen. -6- . aducându-le la forma dorită sub aspect grafic  Dublu clic pe un element din Viewer conduce la intrarea elementului respectiv în regim de editare) Rezultatele din SPSS Viewer se preiau cu Select/Copy şi se depun cu Paste în orice tip de editor de documente. nici SPSS nu poate fi cu adevărat exploatat de către cei care nu au cunoştinţe de statistică. În lipsa acestora. nici alegerea procedurilor şi nici interpretarea rezultatelor nu va fi cu adevărat posibilă.

existente pe un suport de memorie. se procedează astfel:  Se lansează SPSS  Se definesc variabilele bazei de date în domeniul Data Editor  Se introduc datele pentru fiecare caz (subiect) în parte  Se salvează baza de date (extensia specifică este *. elementele de bază rămân aceleaşi ca al versiunile anterioare. fiecare din cele trei situaţii: a) Crearea unei baze de date SPSS În linii generale. fiecare. la intersecţia cărora se formează celulele care conţin.Editarea datelor O bază de date în SPSS este o structură formată din linii şi coloane. Cu toate acestea. pentru crearea unei baze de date proprii în SPSS. c) Importarea unei baze de date din alt format decât SPSS În continuare. b) Deschiderea unei baze de date SPSS.sav) Definirea variabilelor  se acţionează Define variable din meniul Data  soluţie mai directă este dublu clic pe capul de coloană  În versiunile de SPSS mai recente. o bază de date SPSS se obţine pe una din următoarele căi: a) Crearea ei prin operaţiunea de definire a variabilelor şi introducerea datelor de la tastatură. editarea variabilelor se face într-o fereastră specială. -7- .  Existenţa unei baze de date deschisă în fereastra Data Editor este o condiţie obligatorie pentru operarea cu SPSS  SPSS operează numai cu o singură bază de date deschisă la un moment dat În principiu. o anumită unitate de informaţie. vom trata pe rând.

este o zonă care cuprinde butoane de comenzi pentru modificarea setărilor implicite: În zona Measurement. maxim 8 caractere. este o zona informativă în care sunt afişate caracteristicile predefinite ale noii variabile. Change Settings. apare o casetă de dialog ca în imaginea de mai jos (forma ei nu diferă substanţial de la o versiune de SPSS la alta). la unele versiuni). Help (informaţii legate de definirea variabilelor)  În versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de casetă. Variable Description. VAR00001 este numele implicit al primei variabile.Ca urmare a operaţiei de mai sus. Nominal Butoanele OK (pentru finalizarea definirii variabilei. pentru a fi înlocuit cu numele pe care dorim să îl dăm variabilei.  Nu sunt suportate caractere „speciale” cum ar fi spaţiu sau semne de punctuaţie -8- . vom observa următoarele elemente: • • • • • Variable Name: zona de declarare a numelui de variabilă. dar toatele elementele ei constitutive se regăsesc. Cancel (pentru renunţarea la definirea variabilei. Aceste caracteristici se pot seta în Edit-Options (sau Preferences. Dacă privim caseta. Numele variabilei: Orice variabilă SPSS trebuie să aibă un nume. Ordinal. Acesta se şterge. se permite declararea tipului de măsurare specific variabilei: Scale (Interval/Raport). Cele mai importante aspecte legate de denumirea variabilelor sunt următoarele:  Trebuie sa fie format din minim 1.

TR_10. a căror utilizare ca nume de variabile nu este acceptată de program. extrem de utilă. THRU. TR_02. EQ. GE... unde se marchează tipul variabilei şi se declară caracteristicile acesteia (Width. TO. Fiecărui tip îi corespund anumite proprietăţi (caracteristici) care trebuie definite de operator. pentru a se reveni la caseta Define Variable. etc.a. OR. Acestea sunt: ALL. mai ales dacă avem de a face cu o baza de date cu multe variabile.d. însă. conţinutul variabilei • Pentru variabile „înrudite”. Respectarea anumitor convenţii poate fi. WITH. Iată câteva recomandări utile în acest sens (ele nu sunt obligatorii): • Numele să exprime. este de preferat să se declare nume de genul TR_01. Dacă într-o situaţie de acest gen am avea 10 sau mai multe „momente”. astfel.  Alegerea numelui este la latitudinea operatorului.. se păstrează ordinea dorită. TR_2. TR_3 ş. • caracterul underscore este recomandabil ca separator în cadrul numelui de variabilă). în cazul variabilelor numerice) • Se acţionează butonul Continue. deoarece ulterior SPSS aranjează alfabetic variabilele în listele de selecţie şi. AND. se va utiliza o schemă de denumire care să exprime acest lucru.m. LE. LT. GT. De exemplu. SPSS poate opera cu o varietate de tipuri de variabile... NE. apare un mesaj de eroare şi se permite corectarea numelui. NOT. dacă avem variabile care cuprind valori ale timpului de reacţie măsurat în mai multe condiţii. Definirea „tipului” de variabilă Tipul de variabilă se referă la • Se acţionează butonul Type de pe caseta Define Variable • Apare caseta Define Variable Type • . putem declara variabilele TR_1.  Într-o bază de date nu pot exista două variabile cu acelaşi nume!  Există o serie de cuvinte „rezervate”. Aşa cum se observă în caseta Define Variable Type din imaginea de mai sus. În cazul utilizării unor caractere improprii. pe cât posibil. BY. Cele mai uzuale sunt tipurile: -9- . Decimal Places.

Proprietăţi: • numărul de cifre necesare pentru exprimarea „întregilor” • numărul de „zecimale” EXEMPLE: Pentru o variabilă în care vom introduce vârsta în ani împliniţi.). Primele au maxim 8 caractere şi pot fi incluse în unele proceduri statistice (semnificaţia diferenţei între medii.[Numeric]. care pot include valori de timp într-un format specificat. Utilizarea acestora în proceduri statistice nu este limitată de nici o restricţie. practic. acoperind. vom defini Type Numeric cu Width 2 (presupunând că nu avem subiecţi cu vârsta peste 100 de ani) şi Decimal Places 0. Toate variabilele care suportă codificări vor fi. Unităţi de timp calendaristic sau orar [Date]. aşa cum se vede în imagine. care poate fi unul din cele evidenţiate în caseta Define Variable Type/Date Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul „21-FEB2001” (luna fiind scrisă obligatoriu după prescurtarea ei în engleză). [Caracter] (String). de ex. pe când celelalte nu pot fi utilizate decât în operaţii de listare (cazul variabilei de genul „nume”. dar poate fi modificat după dorinţă. care cuprind valori exprimate sub formă de caractere alfanumerice (litere sau chiar cifre). care cuprind valori de tip numeric cu sau fără zecimale. de preferinţă. Există o mare varietate de formate pentru acest tip de variabilă. Proprietăţi • numărul de caractere rezervat. de exemplu). introduse cu valori numerice. definim Type Numeric cu Width 2 şi Decimal Places 1.  SPSS face distincţie între variabile de tip caracter „scurte” (Short string) şi „lungi” (Long string).10 - .  Deşi permisă. Pentru o variabilă în care vom introduce rezultatul la un test exprimat în scoruri T cu o zecimală. orice cerinţă posibilă din partea utilizatorului. . Proprietăţi • formatul de întroducere. care este fixat implicit la 8. utilizarea variabilelor „string” nu este de preferat.

Pentru etichetare se apasă butonul Labels de pe caseta Define Variable. nu au întotdeauna o utilitate practică dar marcarea lor corectă este necesară pentru anumite proceduri statistice sau grafice. eticheta BUN (încă nu a fost acţionat butonul Add pentru a fi finalizată declaraţia etichetei acestei valori). 255). dar şi spaţii sau alte semne grafice tipăribile. dar facem precizarea că semnificaţia lor poate fi găsită în Help-ul casetei Define Variable Type. astfel:  se plasează valorea etichetatăîn zona Value  se introduce eticheta corespunzătoare în zona Value label  se acţionează butonul Add  Operaţiunea se reia pentru toate valorile pe care dorim să le etichetăm. eticheta MEDIU iar valoarea 3. Etichetarea se poate practica atât la nivelul variabilei dar şi la valorile pe care le conţine. Se observă că valoarea 1 are eticheta SLAB. Variabilele de tip Date beneficiază de funcţii speciale de tratare şi analiză în SPSS.  Tipul unei variabile poate fi schimbat ulterior prin simpla redefinire a acesteia. care conţine spaţii pentru eticheta variabilei (Variable Label) şi pentru etichetele valorilor (Value labels). . putând conţine oricâte caractere (max. Imaginea prezintă etichetarea valorilor unei variabile care se referă la calificativul la un examen. în cazul variabilelor de tip nominal sau ordinal. Se va acorda atenţie mesajelor care pot să apară şi care avertizează asupra eventualelor pierderi de informaţie prin schimbarea tipului. Nominal).  Opţiunile din zona Measurement (Scale. Etichetarea variabilelor şi a valorilor Etichetarea este o formă de descriere explicită a conţinutului variabilei (având în vederea că numele variabilei nu poate fi mai mare de 8 caractere). Se deschide o nouă casetă (Define Labels). care se regăsesc doar la versiuni SPSS de la 7. Nu vom prezenta şi celelalte tipuri de variabile. ele fiind mai puţin folosite.  Eticheta variabilei nu se supune restricţiilor pentru nume. Ordinal. valoarea 2.11 - .0 în sus.  Etichetele pentru valori vor fi introduse una câte una.

Forma lor de evidenţiere pe ecran este un punct plasat în celula respectivă. Dacă „se potrivesc”. este foarte recomandabil ca ele să fie atribuite. bare. În plus.  valori lipsă declarate de utilizator (user missing values) adică valori pe care utilizatorul le declară ca atare. pur şi simplu. atunci au fost bine definite.  Oricum. din diverse motive.  Etichetele ajută la citirea mai uşoară a rezultatelor (deoarece apar alături de acestea). este bine să ni le imaginăm ca fiind înscrise pe axele de referinţă ale unui grafic. odată declarate. Declararea valorilor lipsă (missing values) Valorile lipsă sunt de două tipuri:  valori lipsă de sistem (system missing values) adică valori care lipsesc din baza de date (nu au fost introduse). Acestea pot exista în baza de date dar utilizatorul. Să ne gândim numai la valorile extreme ale unei distribuţii. Pentru declararea valorilor lipsă se acţionează butonul Missing Values din caseta Define Variables. Se observă că există mai multe opţiuni:  declararea a trei valori distincte ca fiind lipsă (Discrete missing values)  declarea unui domeniu de valori lipsă (Range of missing values)  declararea unui domeniu la care se poate adăuga şi o valoare distinctă (Range plus one discrete missing value)  Deşi nu pare foarte evidentă acum.) fapt care reduce necesitatea de a le introduce ulterior prin editarea respectivelor grafice. Deşi nimic nu ne obligă să aplicăm etichete variabilelor şi valorilor.12 - . Atenţie. Foarte adesea suntem nevoiţi să scoatem din prelucrări anumite valori (care nu pot fi totuşi. etc. utilitatea funcţiei de declarare a valorilor lipsă nu trebuie subestimată. etichetele sunt asociate prelucrărilor grafice (histograme. declararea variabilelor se compune din următoarele operaţiuni: . a căror menţinere în anumite prelucrări poate determina modifcări semnificative a rezultatelor. aceste valori nu sunt şterse şi nici nu sunt marcate în mod evident pe ecran. şterse). nu doreşte să fie luate în calcul. care generează apariţia casetei de dialog alăturate. ele vor putea fi modificate ulterior sau editate direct în SPSS Viewer.  Pentru a şti cum să declarăm etichetele. În concluzie.

caracter. fişierul rămânând nemodificat. Se va reţine. . produce un meniu contextual care permite un acces mai rapid la funcţiile de inserare/ştergere. în cazul variabilelor măsurate pe scale nominale sau ordinale  Declararea valorilor lipsă (care nu au fost recoltate în procesul de măsurare..Atribuirea numelui (maxim 8 caractere) Definirea tipului (numeric.13 - .  Pentru versiunile de SPSS de la 7 în sus. se defineşte variabila inserată (nume. data) Atribuirea etichetei variabilei Atribuirea etichetei valorilor. etichete). Erori frecvente . totuşi. pe care l-a umplut cu system missing values. prin selectarea acestora (clic pe capul de linie) şi tasta Delete (sau Edit-Cut). Ca urmare. Ştergerea şi inserarea cazurilor  Ştergerea cazurilor se face în mod similar variabilelor. Din acest motiv. există soluţia închiderii bazei de date. valoare care apoi este ştearsă. pentru că datele pot fi definitiv pierdute. fără a se accepta salvarea cerută de program.Apariţia unor cazuri inutile. Explicaţie: Introducerea inutilă a unei valori într-o variabilă.  În cazul unei acţiuni care produce efecte nedorite asupra bazei de date. după care se comandă.. din diferite motive)     Ştergerea şi inserarea variabilelor  Ştergerea unei variabile se face prin selectarea acesteia (clic pe capul de variabilă) şi acţionarea tastei Delete (sau se comandă din meniul Edit-Cut). după care se acţionează în meniul Data-Insert case.  SPSS nu permite Undo (în meniul Edit) decât limitat la ultima acţiune. (umplute cu system missing values) la sfârşitul unei baze de date. tip.  Inserarea unei variabile se face prin plasarea cursorului-celulă pe coloana variabilei în stânga căreia dorim să inserăm noua variabilă (sau prin selectarea variabilei respective). Cu toate acestea. după care se deschide fişierul respectiv din nou. Se pot selecta mai multe cazuri simultan (drag cu mouse-ul pe capul liniilor) după care se şterg ca mai sus. ştergerea variabilelor sau a cazurilor trebuie să se facă cu atenţie.  Inserarea cazurilor se face după plasarea cursorului pe linia deasupra căreia dorim să inserăm un nou caz. clic dreapta pe capul de coloană sau de linie.  Orice modificare efectuată nu produce efecte decât asupra datelor din memoria de lucru. După aceasta. din meniul Data-Insert variable. SPSS a creat deja un caz nou. că baza de date se actualizează pe hard disk numai după salvarea comandată de utilizator.

În plus. Soluţie: Se selectează variabilă resectivă (clic de mouse pe capul de coloană) şi se acţionează tasta Delete (sau Edit-Cut). Width 2. Pentru fiecare dintre informaţiile pe care dorim să le introducem în baza de date vom crea câte o variabilă. Width 2. . pentru a avea controlul datelor dorim să inregistrăm şi identitatea subiecţilor. Explicaţie: La introducerea din greşeală a unei valori într-o variabilă nedefinită în prealabil.Apariţia unor variabile inutile (nedorite). Variabila Numele Tipul variabilei Eticheta Etichetele variabilei variabilei valorilor Identitatea COD (optăm numeric. sau în Decimal Places 0 luni dacă dorim (presupunem că nu mai multă avem subeicţi cu precizie) vârsta peste 99 de ani) Extraversiune EXTRAV Numeric. Vârsta împliniţi. nevrozismul şi atitudinea defensivă (scala Lie). Exemplu practic de realizare a unei baze de date Să ne imaginăm că am aplicat testul Eysenck Personality Inventory. Extraversiune Decimal Places 0 (nu se poate obţine o valoare mai mare de . SPSS creează automat o variabilă implicită. să zicem: sexul şi vârsta. Width 1.14 - . Pentru analiza datelor suntem interesaţi să raprtăm rezultatele la o serie de caracteristic demografice ale subiecţilor. Width 2. Sex 1=feminin Decimal Places 0 2=masculin Vârsta (în ani VIRSTA Numeric. care vizează următoarele caracteristici de personalitate: extraversiunea. pe care o denumeşte VAR00001. Identitate Nu se aplică subiecţielor pentru un cod Decimal Places 0 etichete (esentiala pentru numeric dacă (presupunem că nu decât la a asigura nu avem avem mai mult de 99 valorile identitatea nevoie de subiecţi) variabilelor fiecarei numele de tip inregistrari subiecţilor) categorial inparte si pentru (nominale realizarea sau corespondentelor ordinale) cu alte baze de date in care avem informatii cu privire la aceiaşi subiecţi) Sexul SEX Numeric.Soluţie: Selectarea cazului prin apăsarea pe capul de linie şi acţionarea tastei Delete (sau Edit-Cut).

poate fi declarată de tip caracter (cu valorile M si F) dar. Deşi el poate opera şi cu date de tip caracter. a variabilelor de tip numeric: SPSS este un program de prelucrare statistică.Nevrozism NEVRO Lie LIE 100 şi nu există zecimale) Numeric. variabila sex. pentru explicitarea valorilor se vor folosi etichetele de valoare (value label). Pentru a fi mai expliciţi. să spunem că numele variablei este util în primul rând SPSS-ului pentru a manipula variabilele. la fel de bine. Width 1. este recomandabil să fie utilizate variabile de tip numeric în toate cazurile. Width 2. Pentru a nu avea surprize. VÂRSTA) se poate utiliza fără nici un inconvenient numele şi ca etichetă. respectiv.15 - . fapt care implică date numerice. imaginea DATA EDITOR pentru primii trei subiecţi introduşi cu variabilele de mai sus:  Insistăm pe declararea. În acest din urma caz. Decimal Places 0 (nu se poate obţine o valoare mai mare de 100 şi nu există zecimale) Numeric. de tip numeric (cu valorile convenţionale 1 şi. Decimal Places 0 (nu se poate obţine o valoare mai mare de 9 şi nu există zecimale) Nevrozism „Minciună” Se observă faptul că pentru variabile ale căror nume exprimă exact conţinutul (SEX. acestea nu sunt acceptate pentru toate tipurile de proceduri statistice.  Introducerea unei variabile care să conţină numele subiecţilor poate fi necesară doar dacă ne propunem realizarea unor liste ale . cu precădere. De exemplu. în timp ce etichetele sunt necesare mai ales utilizatorului pentru a înţelege cu uşurinţă la ce se referă o variabilă al cărui nume prea scurt Avem alăturat. 2).

Pentru o bază de date nou creată. câte una pentru fiecare variantă de răspuns. etc. În acest mod vom putea analiza frecvenţa alegerilor pentru fiecare variantă de răspuns în parte. sa zicem „1” dacă este aleasă şi „0” dacă nu este aleasă. de exemplu. datele respective vor fi salvate numai la comanda explicită a operatorului. De exemplu: „Ce activităţi preferaţi pentru timpul liber? 1. petreceri cu prieteni. care deschide următoarea casetă de dialog:  Se alege locaţia de salvare (Save in)  Se dă un nume fişierului (File name)  Se verifică tipul de fişier (formatul implicit pentru baze de date SPSS are extensia . indiferent ce modificări facem în Data Editor pe ecran. Într-un asemenea caz ne putem aştepta să avem mai multe răspunsuri la aceeaşi întrebare. dar pot fi situaţii în care o întrebare prezintă răspunsuri multiple care pot fi alese în acelaşi timp. atunci nu este necesar să declarăm o variabilă pentru „corecte” şi una pentru „greşite” dacă suma lor dă totalul răspunsurilor.sav)  Se acţionează Save . Spre deosebire de WORD de exemplu.”. să se poată identifica numele (pentru corecţii. SPSS nu are o funcţie de salvare automată după un interval de timp prestabilit. salvarea se face în mod similar cu orice alt program cunoscut: File-Save as. şi aşa mai departe. o întrebare prezintă un singur răspuns..16 - .subiecţilor din baza de date. la nevoie. Cu alte cuvinte. 2.  Evitarea variabilelor redundante: Dacă la un test nu sunt posibile.)  Variabile multiple pentru întrebări cu răspuns multiplu: De obicei. Soluţia pentru introducerea datelor este. Vom avea grijă însă. Astfel. 3.. sport. Altfel. astfel încât. Acest lucru nu trebuie niciodată uitat. de aceea. filme. vom avea variabila „SPORT” care poate primi două valori. ca pe documentul original să scriem codul numeric aferent fiecărui subiect. decât răspunsuri corecte sau greşite. crearea mai multor variabile. de ex. scutind un mare volum de muncă pe care l-ar implica introducerea numelor. Salvarea bazei de date din Data Editor O bază de date aflată în lucru nu are un corespondent într-un fişier decât după ce se execută o salvare a acesteia. identificarea numerică a fiecărei înregistrări este suficientă (şi absolut necesară).

 SPSS poate salva şi în alte formate, dintre cele mai importante fiind: Dbase sau FoxPro, Lotus 1-2-3, Excel. Salvarea în aceste formate poate fi utilă pentru transferul datelor pentru prelucrări ulterioare în alte programe. Deschiderea unei baze de date SPSS O bază de date creată cu SPSS se deschide cu comanda File-Open, care activează următoarea casetă de dialog:  Se alege locaţia de citire (Look in)  Se indică fişierul dorit (selectarea cu mouse-ul) în fereastra de căutare  Se indică tipul de fişier ce urmează a fi deschis (implicit este de tip SPSS cu extensia .sav)  Se acţionează Open

 În cazul deschiderii unui fişier de alt tip decât SPSS, se va alege tipul respectiv din lista Files of type. În cazul în care SPSS nu recunoaşte tipul de fişier în care se află datele noastre, putem încerca transformarea lor prealabilă din formatul original într-un format recunoscut de SPSS. Deşi există riscul pierderii unor aspecte ce ţin de formatul de reprezentare a datelor, operaţiunea scuteşte totuşi un mare volum de muncă.

- 17 -

Operaţii de transformare a variabilelor
Dacă privim variabilele SPSS din punctul de vedere al modului în care au fost create, putem distinge două categorii: b) variabile „primare” care includ valori rezultate direct din cercetare si au fost introduse, de regulă, de la tastatură. c) variabile „secundare” rezultate prin transformările aplicate variabilelor primare. Exemple de situaţii în care se impune transformarea variabilelor: • Avem mai multe variabile „primare” care conţin răspunsurile la întrebările unei scale de tip Lickert şi suntem interesaţi să calculăm (într-o variabilă „secundară”) suma răspunsurilor. • Avem un număr de variabile „primare” în care se află rezultatul parţial pentru fiecare minut din cele 10 câte durează un test de calcul aritmetic şi dorim să creăm o nouă variabilă ( „secundară”) în care să avem media performanţei pe cele 10 minute sau abaterea standard a performanţei pe cele 10 minute, pentru fiecare subiect, • Avem o variabilă care conţine data naşterii şi dorim să creăm pe baza ei o altă variabilă, care să conţină vârsta. • Dorim să transformăm variabila care conţine vârsta, într-o altă variabilă care conţine valori pentru categorii de vârstă. Pentru toate aceste situaţii, care sunt unele dintre cele mai des întâlnite, dar şi pentru multe altele încă, SPSS oferă proceduri de transformare în meniul Transform. În continuare, vom prezenta câteva dintre cele mai frecvent utilizate funcţii de transformare a variabilelor. Însumarea valorilor variabilelor Se utilizează atunci când dorim să obţinem o variabilă prin adunarea valorilor din două sau mai multe variabile. Imaginea de mai jos prezintă o tabelă de date SPSS care cuprinde scorurile la trei examene parţiale (scor_1, scor_2 si scor_3). Dorim să realizăm o variabilă care să cuprindă un scor general, prin însumarea celor trei variabile. Se poate observa că unii dintre subiecţi nu au valori la toate cele trei scoruri (valori lipsă de sistem).

- 18 -

Deoarece prin calculare, o nouă variabilă este plasată după toate variabilele existente, am preferat să inserăm o nouă variabilă imediat după cele trei pe care dorim să le însumăm. În acest fel avem şi posibilitatea să controlăm uşor corectitudinea operaţiei de însumare Se apelează procedura Transform-Compute, care deschide caseta de mai jos:

Se efectuează următoarea succesiune de operaţii: 1. Se introduce numele noii variabile în zona Target Variable („total”). 2. Se scrie expresia de însumare în zona Numeric Expression. Funcţia este SUM (expresie numerică, expresie numerică, ...), aşa cum se vede şi în zona listei Functions: Ea poate fi scrisă de la tastatură sau selectată din lista de funcţii şi „ridicată” prin acţionarea butonului ▲. Atenţie, sintaxa fiecărei funcţii trebuie respectată întocmai. În cazul nostru, variabilele numerice se vor scrie între paranteze, una câte una, cu virgulă între ele. Variabilele pot fi scrise de la tastatură sau mutate la rândul lor din lista de variabile cu butonul ►. - 19 -

Deoarece variabila total există.20 - . unde . arată că putem pune oricâte variabile (sau valori) numerice. ca în cazul exemplului nostru. 3. se procedează în mod similar... cu virgulă între ele. cu condiţia ca variabilele pentru care se realizează media să se afle una după alta în tabela SPSS. expresie_numerică.. deoarece ştim că am creat această variabilă tocmai pentru a depune în ea suma. atunci avem posibilitatea să scriem o expresie de însumare simplificată. Răspundem OK. Expresia de calcul a mediei este MEAN (expresie_numerică. Dacă nu ar exista o variabilă cu acest nume. ne-ar interesa media valorilor de la mai multe variabile. . se poate realiza o expresie cu clauza TO. SPSS ne întreabă dacă dorim să modificăm conţinutul acesteia.. rezultatul operaţiei de calcul ar fi depus într-o variabilă creată automat şi amplasată după ultima variabilă din baza de date. . Această opţiune ne sugerează cât de important poate fi să aranjăm corespunzător variabilele în structura unei tabele SPSS. Rezultatul operaţiei se vede în imaginea de mai jos: Calcularea mediei a două sau mai multe variabile Presupunând că în loc de sumă. astfel SUM (prima_variabilă TO ultima_variabilă). clauza TO va fi cuprinsă între spaţii. pentru a nu fi confundată cu un nume de variabilă. În acest caz.Dacă variabilele ce vor fi însumate se află în baza de date una după alta.). Ca şi în cazul sumei. Se apasă butonul OK 4.

Dintre acestea. pentru acelaşi subiect.21 - . Pentru a avea vârsta. la nivelul fiecărei variabile în parte. scos dintr-o variabilă care conţine data naşterii. Extragerea anului dintr-o variabilă de tip cronologic (date) SPSS oferă funcţii de transformare cu variabilele de tip cronologic.sav Observăm că variabila bdate. utilizându-se marea varietate de funcţii care se găsesc în lista Functions şi a căror semnificaţie se poate află din Help-ul casetei Compute. fără utilizarea funcţiilor (SUM sau MEAN). vom exemplifica cu realizarea unei variabile care să conţină anul naşterii. care se referă la suma sau media valorilor de la mai multe variabile. prin selectare şi acţionarea butonului ▲. astfel: Pentru sumă: scor_1+scor_2+scor_3 Pentru medie: (scor_1+scor_2+scor_3)/3  Se va face o distincţie clară între suma sau media astfel obţinute. care conţine data naşterii. trebuie să calculăm diferenţa dintre anul curent (să zicem. 2000) şi anul naşterii: Pentru . şi suma sau media pe care am calcula-o pe verticală. pe întreaga distribuţie  Se pot realiza diverse alte funcţii de transformare.Reamintim că funcţia MEAN poate fi scrisă de la tastatură sau poate fi adusă din lista de funcţii. Imaginea de mai jos este extrasă din baza de date Employee data. să zicem. Este de la sine înţeles că expresia de calcul poate fi realizată şi într-o manieră simplă şi directă.

 Posibilităţile de transformare a variabilelor oferite de SPSS permit crearea unor noi variabile pe baza celor existente. apoi. vom insera o variabilă (denumind-o „virsta”. prin efectuarea unei noi transformări realizarea diferenţei dintre anul curent şi anul naşterii.22 - .aceasta trebuie să facem diferenţa dintre anul curent (2000) şi anul naşterii. în funcţie de necesităţile de prelucrare pe care le avem. însă.YEAR(bdate) Mai jos putem vedea rezultatul procedurii Compute: Se observă în variabilă virsta. În toate cazurile. Apoi utilizăm procedura Compute din meniul Transform: În câmpul Target variable introducem numele noii variabile (virsta). Mai întâi prin extragerea anului naşterii într-o variabilă separată şi. putem scrie expresia astfel: 2000-XDATE. În cazul nostru. de tip numeric. cu doi întregi). care se află în câmpul bdate. care se bazează pe funcţia XDATE.YEAR(bdate)=anul naşterii Ca urmare. valorile rezultate prin transformare (corespunzătoare anului 2000).Desigur. În zona Numeric Expression vom scrie expresia de transformare.YEAR(). transformarea putea fi efectuată şi în două etape. Pentru a avea variabila ce urmează a fi creată în apropierea variabilei bdate. nu se va alege soluţia modificării valorilor . XDATE. Am preferat o soluţie într-o „singură etapă” pentru că este mai operativă. Această funcţie are ca rezultat extragerea valorii care reprezintă anul dintr-o variabilă de tip dată calendaristică.

în caz de necesitate. se poate opta pentru un număr de clase care serveşte cel mai bine interesul de cercetare. în cazul unei distribuţii de vârstă exprimată în ani. acestea având şi o anumită semnificaţie „psihologică”. deşi este recomandabilă obţinerea unei grupări de frecvenţe pe 5-15 clase. am obţinut variabila virsta. Utilizarea ei ca atare în analize statistice este improprie. cu scopul obţinerii unei distribuţii bazată pe frecvenţe cumulate.dintr-o variabilă „primară” peste valorile deja existente. De exemplu.Into Defferent Variables din meniul Transform: . În urma transformării de mai sus. este preferabil să se opteze pentru clase „cincinale” sau „decade”. Recodificarea variabilelor Recodificarea unei variabile înseamnă convertirea valorilor acesteia.23 - . şi nu să modificăm valorile existente din variabilele „primare” a căror pierdere ar necesita reintroducerea lor. Pentru aceasta putem efectua „recodificarea” variabilei virsta pentru a obţine o distribuţie grupată de frecvenţe. este recomandabil să creăm prin transformare variabile noi. Procesul este similar cu crearea unei tabele de frecvenţe grupate şi ne reamintim că poate fi derulat în maniera descrisă mai jos: Paşi pentru grupării de frecvenţe: • Se face diferenţa dintre valoarea cea mai mare şi valoarea cea mai mică a unei distribuţii • Se împarte valoarea obţinută la mărimea posibilă (estimată) a intervalului • Se selectează mărimea intervalului care conduce la un număr de clase cuprins între 5 şi 15 • Se determină limita inferioară a primului interval (trebuie să fie un multiplu al mărimii intervalului) • Se determină limita superioară a primului interval • Se construiesc intervalele de clasă pentru fiecare interval. de aceea ar fi foarte utilă obţinerea unei variabile care să asocieze anumite valori convenţionale pentru categorii de virsta. Cu alte cuvinte. astfel: Se lansează procedura Recode . fiind atenţi să avem clase „suprapuse” sau „intervale neacoperite” În principiu.

În fine.24 - . se acţionează butonul Old and New Values Deşi relativ complicată. se poate alege şi opţiune Into Same Variables. acţionăm butonul Add pentru a definitiva operaţiunea şi trecem la definirea următoarei clase. butonul OK. Am ales. scriem care este valoarea pe care o asignăm acestei clase.d. În zona Old value. v_clase. Urmează acum să descriem limitele claselor de recodificare. după care se apasă butonul Change. Se acţionează butonul Continue şi. până terminăm. Paşi de efectuat la apariţia casetei Recode into Defferent Variable: • se trece variabila virsta în zona Numeric Variable → Output Variable. dar nu este recomandabilă deoarece. ca nume al variabilei recodificate. se alege una dintre variantele de definire a valorilor de la care se pleacă. în zona New value oValue.a. primul interval fiind 29-39. Pentru aceasta. După aceasta. al doilea 40-49. • Acest nume se scrie în zona: Name. În zona Old→New se poate observa lista recodificărilor definite. absolut convenţional. la revenirea în caseta anterioară. Semnul întrebării arată că se aşteaptă numele variabilei ce urmează să fie creată prin recodificare.Atenţie. Rezultatul operaţiuni se vede mai jos: . în cazul unei erori. caseta de declarare a noilor valori în funcţie de cele vechi este uşor de înţeles. Pentru aceasta activăm opţiunea Range şi scriem valorile limite al intervalului dorit. ş. nu mai avem la dispoziţie variabila iniţială pentru o nouă recodificare.m. Să zicem că am ales soluţia să recodificăm anii pe intervale de zece ani.

ar trebui să intrăm din nou în procedura Recode şi să redefinim clasele). (De regulă. cu valoarea din variabila v_clase. să operăm cu grupe de vârstă. Transformarea operată pe variabila vîrstă nu este de loc inutilă. Pentru valoarea 71. relua. una din soluţiile posibile este transformarea de rang. Într-o situaţie de acest gen. cu procedura Transform-Rank cases (caseta din dreapta): . unde valoarea 250 este excesivă). această situaţie este determinată de o eroare de definire a intervalelor de clasă. În analizele statistice pe vârste este recomandabil.Se observă corespondenţa dintre valoarea din variabila virsta. este posibil să ne confruntăm cu o variabilă cantitativă ale cărei valori nu respectă condiţiile unei statistici parametrice (vezi figura din stânga. Pentru a o repara. ar fi fost oarecum impropriu (fără a fi propriu-zis o greşeală ) să utilizăm o statistică parametrică (corelaţia). avem missing value în variabila v_clase. totuşi. deoarece nu am definit un interval care să cuprindă această vârstă.25 - . Ordonarea după rang a valorilor unei variabile Aşa cum am spus în cuprinsul primei părţi a acestui volum. Dacă am fi dorit să vedem în ce măsură este o relaţie între nivelul salariului şi vârstă.

Ea este utilă mai ales pentru inspectarea directă a valorilor de la extrema unei distribuţii sau pentru listarea ordonată a bazei de date. Le vom trece în revistă.Variabila vizată (scor) este trecută în lista Variable(s). Baza de date nesortată Caseta Sort Cases Imaginea din casetă descrie sortarea bazei de date. de exemplu: grup(Ascending) şi scor(Descending). selectarea unor seturi de date. crescător (Ascending).26 - . . Procedura permite fixarea unor parametri de transformare cu ajutorul butoanelor Rank şi Ties. asupra cărora nu insistăm aici. fiecare în sensul dorit. Se poate efectua sortarea simultană după mai multe variabile. Organizarea datelor pentru analiză SPSS permite efectuarea unor operaţii de organizare a datelor care prezintă un interes aparte pentru faza de analiză. împărţirea fişierului în subgrupuri. Procedura utilizată este: Data-Sort. adăugarea de variabile). pe rând. combinarea fisierelor (adăugarea de cazuri. Acestea sunt: sortarea. după valorile variabilei scor (rezultatul se vede în imaginea de mai jos). se setează modul de ordonare (am ales atribuirea rangului 1 valorii celei mai mari) iar apoi am acţionat butonul OK. Sortarea bazei de date Sortarea este operaţia de aranjare a bazei de date în funcţie de ordinea crescătoare/descrescătoare a valorilor unei variabile.

caseta principală Select Cases care are: o Zona listei de variabile o Zona fixare a condiţiilor de selectare Select. Dacă nu se optează pentru ştergerea datelor neselectate. să ne propunem selectarea din baza de date din imaginea de mai sus a cazurilor aparţinând grupului 1. se va reveni în procedura Split File şi se va seta opţiunea Analyze all cases. Procedura este Data-Select Cases. Procedura este: Data-Split File iar caseta de dialog este cea de mai jos: • • • Opţiunile sunt: Analyze all cases. pentru analiză distinctă. unde: . baza de date • La mijloc. Atunci când datele sunt astfel organizate... orice procedură de analiză se va efectua distinct pentru fiecare subgrup.Împărţirea bazei de date în subgrupuri Baza de date SPSS poate fi împărţită în subgrupuri. do not create groups (pentru analiza integrală a datelor) Compare groups (rezultatele vor fi afişate astfel încât să poată fi uşor comparate) Organize output by groups (rezultatele vor fi afişate în Viewer. Singurul efect se vede în zona de afişare a rezultatelor. separat pe grupuri)  Operaţia nu produce nici o modificare vizibilă asupra bazei de date. Pentru exemplificare.. Selectarea unor seturi de date Selectarea unui set de date permite aplicarea procedurilor de analiză numai pe cazurile selectate.  Pentru a se reveni la analiza intergrală a datelor. ele vor fi păstrate şi vor putea fi reintroduse în analiză. Imaginea prezintă: • În partea stângă. unde toate procedurile de analiză vor fi afişate pentru fiecare subgrup în parte...27 - ..

dar sunt permise selecţii bazate pe funcţii mai complicate sau care pot să includă combinaţii de variabile. dar actualizarea fişierului de pe hard disk se va face numai după prima comanda Save. care deschide caseta Select Cases: if.o o o o All cases este setarea implicită şi înseamnă că toate datele intră în analiză  If condition is satisfied.  După finalizarea operaţiei de selectare de mai sus. În cazul nostru. Use filter variable. am trecut variabila grup în zona de editare a functie şi am declarat-o egală cu 1. se bifează atunci când se doreşte declararea unei condiţii de selectare bazată pe o funcţie  IF este butonul de deschidere a casetei pentru declararea condiţiei. permite selectarea unui set aleator de cayuri din baya de date Based on time por case range. permite selectarea cazurilor în funcţie de poziţia din baza de date. celelalte fiind ignorate. toate cazurile din baza de date care au grup=1 vor fi analizate. Exemplul se bazează pe o selecţie simplă. permite opţiunea de filtrare a cazurilor neselctate (Filtered) sau de eliminare a lor (Deleted). cazurile neselectate vor fi şterse. dar baza de date. selectează pe baza valorile unei variabile filtru Unselected cases Are. Random sample of cases. Astfel. În acest din urmaă caz. baza de date se prezintă în felul următor: .28 - .

atunci când există înregistrări multiple pentru fiecare subiect şi se doreşte păstrarea uneia singure (Data-Agregate) • Adăugarea unor cazuri din altă bază de date SPSS (Data-Merge Files-Add cases. prin bifarea opţiunii All cases).. Această variabilă poate fi ulterior utilizată în procedurile de analiză..) • Adăugarea unor variabile din altă bază de date SPSS (Data-Merge Files-Add variables..) • Inversarea liniilor cu coloanele (Data-Transpose.29 - . ne vom mulţumi să le prezentăm sumar: • Agregarea cazurilor. ca variabilă independentă (caz în care se va anula situaţia de selectare... Adesea se uită anularea unei selectări existente. Efectul este obţinerea unor rezultate pe date parţiale. Alte operaţii de organizare a datelor pentru analiză Opţiunile SPSS pentru organizarea datelor sunt mult mai numeroase decât cele descrise mai sus.) .  Selectarea este utilizată în mod obişnuit. Fără a le trata în amănunt. pentru alegerea temporară a unui set de date..• • Se observă: Marcarea cu o diagonală a capului de linie corespunzător cazurilor neselectate Apariţia unei variabile de sistem filter_$ care conţine valoarea 0 pentru cazurile neselectate şi valoarea 1 pentru cazurile selectate. atunci când se doreşte revenirea al analiza tuturor cazurilor.

pe de altă parte.Calcularea indicatorilor statistici descriptivi Reamintim faptul că statistica descriptivă are ca obiectiv analiza caracteristicilor variabilelor. pe de o parte. Fie şi acest aspect numai. Descriptives şi Explore.  Aceste proceduri oferă prelucrări distincte dar conţin şi rezultate comune.30 - . În ceea ce priveşte procedurile specializate. pe cale: o numerică (analiza de frecvenţe) o grafică (bară. proceduri specializate şi. La apariţia casetei Frequencies. box-plot. în ciuda caracterului ei „elementar”. opţiuni care pot fi accesate din interiorul altor proceduri. variabila pe care dorim să o supunem analizei va fi trecută în lista de calcul Variable(s). Alegerea uneia sau alteia dintre ele depinde de necesităţile de analiză. histogramă. pentru versiunile mai noi de SPSS) şi sunt grupate în trei proceduri: Frequencies. Procedura Frequencies Este singura care permite analiza de frecvenţe. prin selectarea ei şi acţionarea butonului de . este o componentă indispensabilă a analizei statistice. stem and leaf) • valorile tendinţei centrale o mod o medie o mediană • valorile împrăştierii o amplitudine o abatere standard • valorile formei distribuţiei o indice de simetrie (skewness) o indice de boltire (kurtosis) SPSS oferă posibilităţi variate de reprezentare şi de calcul a acestor indicatori. ele se lansează din meniul StatisticsSummarize (sau Analyze-Descriptive statistics. ar trebui să sugereze că analiza statistică descriptivă. În acest sens există. Principalele elemente de statistică descriptivă sunt: • reprezentarea întregii distribuţii.

nu alăturat. În plus. pentru fiecare în parte.transfer (►). Pot fi incluse mai multe variabile în această listă. aşa cum sunt aranjaţi aici): Indicatorii statistici descriptivi Tabelul de frecvenţe Histograma Procedura Descriptives . care este funcţia specifică a acestei proceduri. Se va observa pe caseta de mai sus bifarea opţiunii pentru tabela de frecvenţe. astfel: Butonul Statistics Butonul Chart Butonul Format Se aleg indicatorii statistici Se alege tipul de Se aleg diverse moduri de descriptivi doriţi grafic dorit prezentare a rezultatelor Rezultatele sunt afişate în SPSS Viewer în forma de mai jos (dar unele sub altele. prin acţionarea butoanelor din partea de jos a casetei se pot seta alte analize. rezultatele fiind afişate distinct.31 - .

se bifează opţiunea din stânga-jos a casetei ) Rezultatul analizei. în funcţie de care se doreşte analiza variabilei analizate .32 - . La lansare. din Viewer Imaginea bazei de date. Se trec variabilele vizate în lista Variable(s) Se aleg indicatorii doriţi din Options (dacă dorim calcularea scorurilor z. Procedura Explore Procedura Explore este cea mai complexă dintre toate procedurile statisticii descriptive şi se poate utiliza atunci când se doreşte o analiză exhaustivă a variabilei (sau variabilelor). Satistics-Descriptives. Caseta principală Explore • • În Dependent List se includ variabilele de analizat În Factor List se includ eventualele variabile categoriale.Această procedură vizează doar indicatorii statistici descriptivi. în care se vede apariţia variabilei zscor (denumită automat de progarm) cu valorile transformate în scoruri z. se deschide caseta principală Descriptives.

33 - . implicit toţi indicatorii statistici descriptivi. se prezintă astfel: Indicatorii statistici Reprezentarea stem-andleaf Reprezentarea Box plot . de bază) Butonul Plots. grafice (Plots) sau ambele categorii (Both) Butonul Statistics deschide caseta pentru alegerea unor indicatori (dar procedura analizează.• • • • Label cases by. definită mai sus. permite alegerea opţiunilor de afişare a rezultatelor numerice (Statistics). permite setarea modului de tratare a valorilor lipsă Rezultatele analizei Explore. permite alegerea reprezentărilor grafice dorite: • Butonul Options. permite etichetarea cazurilor la afişare (rar utilizat) Display.

În temeiul teoremei limitei centrale. Atunci când volumul eşantionului este mic (N<30) este utilizată o variantă denumită testul t pentru un singur eşantion. Procedura: Statistics-Compare Means-One Sample T Test Caseta principală Variabila testată este trecută în lista Test Variable(s) În zona Test Value se înscrie media populaţiei (100 în cazul nostru) Caseta Options permite alegerea pragului de semnificaţie.05 şi este implicit pentru toate testele statistice Variabila testată . cum sunt cele antropometrice. Testul poate fi utilizat.Teste parametrice Testul z (t) pentru media unui singur eşantion Utilizare Testul z pentru un singur eşantion este utilizat pentru se testa diferenţa dintre media unui eşantion faţă de media cunoscută a populaţiei din care face parte. Dintre variabilele psihologice ale cărei medii pentru populaţie este cunoscută. se poate testa diferenţa dintre nivelul de satisfacţie la nivelul unei secţii faţă de media satisfacţiei la nivelul întregii organizaţii (populaţie). Condiţii de aplicare Condiţia teoretică de bază este normalitatea distribuţiei de eşantionare. atunci când populaţia are o extindere mai redusă. însă. acest lucru este dificil de realizat (în afara cazurilor în care există studii speciale. Confidence Interval 95% este echivalent cu p=0. Dacă populaţia are o extindere mare.34 - . cu atât normalitatea distribuţiei de eşantionare este mai sigură. este inteligenţa. De exemplu. Utilizarea acestui test statistic este condiţionată de cunoaşterea mediei populaţiei. dacă a fost evaluat nivelul de satisfacţie într-o organizaţie. exprimată în unităţi QI (μ=100). de exemplu). cu cât volumul eşantionului este mai mare. Aranjarea datelor Datele supuse testării trebuie să fie incluse într-o variabilă SPSS de tip numeric.

. ca medie a populaţiei. ab.6) şi limitele inferioară (12.63) ale intervalului de încredere pentru media populaţiei estimată de eşantionul de cercetare.std.254. media. Concluzia testului: media eşantionului de cercetare diferă semnificativ de QI=100.Rezultate Primul tabel include statistica descriptivă a variabilei testate (N. p=0.35 - .03. diferenţa faţă de media populaţiei (22. eroarea standard a mediei) Al doilea tabel include rezultatele testului statistic: t=6.57) şi superioară (32. df=4.

testul t poate fi utilizat pentru eşantioane oricât de mici. cu două valori. iar în funcţie dacă rezultatul său programul calculează testul t pe două căi. scorul la sociabilitate este variabila dependentă. astfel: • Testul z pentru proporţii (compararea procentului de „sociabili” din cele două grupuri) • Testul Mann-Whitney U. În acest caz. exprimată pe scală nominală dihotomică (familie/instituţie de ocrotire) Condiţii Teoretic. ea este testată cu un teste specifice. aşa cum vom vedea mai jos. În ce priveşte condiţia egalităţii varianţei. Unul dintre acestea este testul Levene. de tip nominal. recomandăm cea de a doua variantă. se poate apela la teste neparametrice. Exemplu: testarea diferenţei dintre media scorului la o scală de sociabilitate aplicată unor copii crescuţi în familie şi unor copii crescuţi în instituţii de ocrotire. de tip numeric. dacă distribuţia de eşantionare pentru cele două grupuri este normală şi dacă varianţa valorilor în cele două grupuri nu diferă semnificativ. Din principiu. dacă se transformă valorile variabilei „sociabilitate” în valori de rang Aranjarea datelor Tabela de date SPSS va conţine variabila dependentă. şi variabila independentă. Variabila independentă poate fi de tip „string” (codificând cele două grupuri cu valori de genul „A” şi „B”) sau de tip numeric (cu codificarea convenţională 1 şi 2). în funcţie de apartenenţa la un grup sau altul. Dacă variabila dependentă nu întruneşte condiţiile pentru testul t.Testul t pentru eşantioane independente Utilizare Testul t pentru eşantioane independente este utilizat pentru testarea diferenţei dintre mediile aceleiaşi variabile dependente măsurate pe două grupuri.36 - . măsurată pe scală cantitativă (interval/raport) iar mediul de educare este variabila independentă. formate din subiecţi diferiţi. însă. Procedura: Statistics-Compare means-Indpendent Samples T Test .

Rezultate .În caseta principală se trece variabila dependentă (soc) în lista Test Variable(s) (pot fi testate mai multe variabile simultan) iar variabila independentă (grup). sugerând introducerea valorilor care definesc cele două grupuri. După acţionarea butonului Continue. unde se introduc valorile care definesc cele două grupuri comparate (ordinea lor nu este relevantă). programul ataşează variabilei dependente două semne de întrebare. Concomitent. în zona Grouping Variable.37 - . caseta principală devine completă şi se poate acţiona OK pentru efectuarea testului. se activează butonul Define Groups a cărui acţionare deschide caseta secundară Define Groups. În acest moment.

05 pentru distribuţia F a testului Levene. în loc de „institutie” şi „familie” ar fi apărut 1. Pentru exemplul nostru. respectiv. Sig. Al doilea tabel are două linii: Pe prima avem rezultatele testului t pentru cazul asumării omogenităţii varianţei (Levene’s Test for Equality of Variances). Ca urmare. În cazul nostru. vom citi pe această linie rezultatul testului: t=-2.666.00) decât cei crescuţi în mediu instituţional (m=17. Pe a doua linie avem rezultatele testului t pentru cazul în care nu s-ar întruni condiţia de omogenitate a varianţei pentru cele două grupuri.42.38 - . pe care nu o discutăm aici). deci mai mare de 0.666. 2.=0. Dacă semnificaţia testului Levene ar fi fost mai mică sau egală cu 0. rezultatul testului t permite acceptarea ipotezei cercetării.05. Dacă acestea nu ar fi fost definite. Se va observa că programul descrie grupurile prin intermediul etichetelor valorilor. ceea ce se traduce ca o valoare p=0. ele sunt egale (Sig. .În primul tabel (Group Statistics) avem statistica descriptivă a celor două grupuri.045. df=12. rezultatului testului t s-ar fi citit pe această linie. conform căreia copiii crescuţi în mediu familial sunt mai sociabili (m=22.=0.71).

ori în două contexte diferite. Ipoteza cercetării este că zgomotul determină o reducere a capacităţii de calcul numeric. în condiţii de zgomot puternic. se pot utiliza teste neparametrice echivalente: testul semnului (pentru date nominale) sau testul Wilcoxon (pentru date ordinale). În situaţia în care condiţia nu se îndeplineşte. .Testul t pentru eşantioane dependente (perechi) Utilizare Testul t al diferenţei mediilor a două eşantioane dependente permite evaluarea semnificaţiei variaţiei unei anumite caracteristici la aceeaşi indivizi în două situaţii diferite (de exemplu. Aranjarea datelor Vor fi create două variabile distincte. Ca şi în celelalte cazuri. măsurate pe scală de tip I/R. Exemplu: Un grup de subiecţi efectuează operaţii aritmetice în condiţii de linişte şi. indiferent de momentul manifestării acestora). „înainte” şi „după” acţiunea unei anumite condiţii. Condiţii Condiţia teoretică a testului este normalitatea distribuţiei de eşantionare a distribuţiei de diferenţe. ambele cantitative. care primesc câte o valoare pentru fiecare subiect. Avantajul major al acestui model statistic este acela că surprinde variaţia numită „intrasubiect”.39 - . ulterior. prin faptul că baza de calcul este diferenţa dintre cele două valori ale fiecărui subiect în parte. teorema limitei centrale determină normalizarea distribuţiei de eşantionare pe măsură ce volumul eşantionului creşte.

dar oferă o informaţie diferită de testul diferenţei dintre medii. Alegerea testului de corelaţie sau al testului t se decide în funcţie de obiectivul cercetării. perechea de variabile se trece în lista Paired Variables cu butonul de transfer (►). . Al doilea tabel conţine testul de corelaţie Pearson (r) dintre cele două variabile.Procedura: Statistics-Compare Means-Paired Sample T Test.40 - . Caseta Options permite alegerea pragului de semnificaţie (implicit 0. Evaluarea intensitatea asocierii liniare dintre cele două variabile este legitimă în acest context. fiecare dintre cele două variabile. Astfel se constituie perechea de variabile în zona Curent selection.05). Rezultate Primul tabel conţine statistica descriptivă pentru cele două variabile.. pe rând. O dată constituită. Pot fi create mai multe perechi de variabile şi prelucrate simultan. Se selectează cu un clic de mouse..

şi preferinţa pentru risc pe de altă parte. p=0. Absenţa oricărei legaturi (corelaţii) dintre variabile se traduce prin r=0. Testele neparametrice alternative. să luăm în considerare situaţia în care se urmăreşte evidenţierea legăturii (asocierii) dintre anxietate şi agresivitate. Procedura: Statistics-Corelate-Bivariate Variabilele supuse corelaţiei vor fi trecute în lista Variables: . Condiţii Condiţia principală pentru calcularea coeficientului de corelaţie liniară Pearson este ca variabilele implicate să fie măsurate pe scală de interval/raport (alături de existenţa unei forme a distribuţiei care nu se abate sever de la curba normală). pe de o parte. Acest fapt conduce la ceea ce se numeşte o matrice de corelaţii care este un tabel ale căror celule cuprind corelaţiile dintre perechile de variabile.41 - . Aceasta se referă la gradul şi sensul de variaţie concomitentă a valorilor unei variabile în raport cu cealaltă.076. Domeniul de variaţie a coeficientului de corelaţie Pearson (r) este între r=-1 (corelaţie perfectă negativă) şi r=+1 (corelaţie perfectă pozitivă). Pentru exemplificare. într-o cercetare psihologică numărul variabilelor supuse corelaţiei este mai mare de două. după un model de tip liniar. Aranjarea datelor Se creează variabile distincte pentru fiecare caracteristică supusă testării. ultimul tabel prezintă rezultatul testului: t=5. Coeficientul de corelaţie liniară Pearson (r) Utilizare Corelaţia Pearson (r) măsoară gradul de asociere dintre variabile.001. Exemplu: Testul de corelaţie implică două variabile dar. pentru cazul în care condiţiile pentru utilizarea testului Pearson nu se îndeplinesc. sunt: testul chi-pătrat (pentru date nominale) sau coeficienţii de corelaţie Spearman sau Kendall (pentru date ordinale). df=9.În fine. Acesta permite respingerea ipotezei de nul şi acceptarea ipotezei cercetării. zgomotul afectează capacitatea de calcul aritmetic. adesea.

odată deasupra diagonalei.01. dar se poate bifa un altul (Kendall sau Spearman).Testul implicit. pentru a scoate în evidenţă valorile semnificative ale lui r. determină marcarea cu un asterisc a coeficienţilor semnificativi la p=0. dar se poate alege unilateral (dacă există o justificare solidă). este Pearson. Flag significant correlations. Fiecare celulă include următoarele informaţii: • valoarea lui r • nivelul p • numărul de subiecţi (N) . Acest lucru este util atunci când matricea de corelaţie este mare. nici un interes.05 şi cu două asteriscuri a celor semnificativi la p=0. Tipul implicit de testare a ipotezei este bilateral (Two-tailed). El este redundant. din zona Correlation Coefficients. odată sub diagonală. Corelaţiile variabilelor cu ele însele sunt perfect pozitive (r=1) şi nu prezintă. desigur.42 - . deoarece prezintă aceleaşi corelaţii de două ori. Rezultate Tabelul rezultatelor cuprinde matricea de corelaţii a variabilelor analizate. dacă datele sunt neparametrice.

nu şi de corelaţia dintre anxietate şi agresivitate. Să presupunem că suntem interesaţi de corelaţiile dintre anxietate şi agresivitate cu variabila preferinţă pentru risc. pe de altă parte (r=-0. al cărui efect este deschiderea domeniului Syntax. dacă avem grijă să le aşezăm separat în listă şi să includem clauza WITH între cele două categorii de variabile. consemnăm corelaţii negative dar nesemnificative între anxietate şi agresivitate (r=-0. p=0. pe de o parte. Nu pot fi incluse mai multe clauze WITH în aceeaşi procedură.43 - . În acest caz. în care se află sintaxa procedurii de corelaţie. chiar dacă programele îi calculează cu trei zecimale. având grijă să existe spaţiu atât în stingă cât şi în dreapta sa.În cazul nostru. Pentru corelaţii implicând multe variabile tabelul se va cit cu relativă dificultate. prezentată mai sus. Acolo. Dezavantajul acestui tip de tabel constă în faptul că avem de fapt o dublă prezentare a corelaţiilor. p=0. se selectează întreaga procedură (cu ajutorul mouse-ului) şi se apasă pe butonul Run (►) de pe bara de comenzi a ferestrei Rezultatul din Viewer va arăta ca mai jos: Este evident că această modalitate se poate aplica pentru oricât variabile. variabilele vor fi introduse astfel încât variabila „preferinţa pentru risc” sa fie ultima din listă. pe linia /VARIABLES=anx agresiv risc. În acelaşi timp. ca o fereastră distinctă.40. inseraţi WITH Mai departe. se inserează cuvântul WITH. Precizăm faptul că raportarea coeficienţilor de corelaţie se face cu două zecimale. se constată o corelaţie semnificativă (r=0.26). în caseta principala. .96. şi între anxietate şi preferinţa pentru risc. Bivariate Correlations.38. Apoi se apasă butonul Paste. p<0. deasupra diagonalei şi sub diagonală.24).001) între agresivitate şi preferinţa pentru risc.

44 - . Expresia grafica a corelaţiei (Scatterplot) Caracterul şi intensitatea corelaţiei dintre două variabile se evidenţiază extrem de sugestiv cu ajutorul unei proceduri grafice specifice. Se apasă OK şi se obţine graficul din imaginea următoare.. care sugerează foarte clar existenţa unei asocieri de tip liniar între cele două variabile.Ulterior. În acest scop. putem reveni în fereastra Syntax pentru a o închide (cu File-Close). selectăm pe caseta Scatterplot opţiunea Simple şi apăsăm Define. singura semnificativă. numită scatterplot. să presupunem că dorim reprezentarea grafică a corelaţiei dintre agresivitate şi preferinţa pentru risc. Trecem variabila Agresivitate pe axa Y şi variabila Preferinţa pentru risc pe axa Z (se poate la fel de bine şi invers).. salvând sau nu procedura astfel modificată. . Aceasta se lansează din meniul principal Graphs-Scatter. care deschide următoarea casetă de dialog: În cazul nostru.

între agresivitate şi preferinţă pentu risc. De fapt. deoarece graficul poate scoate în evidenţă o legătura de alt tip decât liniară.92. .  O corelaţie r=0. decât că sunt distincte. motiv pentru care este recomandabilă utilizarea frecventă a acesteia.45 - . ar trebui să concluzionăm mai degrabă că cele două variabile se confundă. Mai mult. este improbabil să se întâlnească într-un studiu real.Reprezentarea grafică este sursă de informaţii cu privire la natura relaţiei dintre variabile. dacă s-ar întâmpla să apară. ea este necesară în special atunci când valoarea corelaţiei este redusă. ca cea obţinută mai sus. sau nesemnificativă.

Acest fapt poate sugera o relaţie de tip cauzal între variabile. condiţiile variabilelor care sunt supuse analizei de regresie sunt aceleaşi ca în cazul corelaţiei. Vom prezenta mai jos regresia liniară simplă. în care există o singură variabilă predictor (agresivitatea) şi o variabilă criteriu (tendinţa spre risc) se numeşte regresie liniară simplă. de regulă.Regresia liniară simplă Utilizare Analiza de regresie este o aplicaţie a corelaţiei. Acest tip de regresie. evaluarea variabilei predictor anterior variabilei criteriu. Din punct de vedere metodologic. mai uşor de înţeles. predicţia presupune. ca o formă de introducere în analiza de regresie. deoarece regresia liniară este o aplicaţie a acesteia. . Aranjarea datelor Structura de variabile este similară analizei de corelaţie.46 - . Dacă evaluăm agresivitatea ca trăsătură de personalitate şi preferinţa pentru risc ca expresie a numărului de incidente în trafic. Exemplu: Predicţia rezultatului statistică pe baza cunoştinţelor de matematică. la conducătorii auto. dar numai dacă sunt întrunite şi alte condiţii (cum ar fi izolarea efectelor altor variabile). se poate estima pe baza agresivităţii riscul de accident încă înainte de dobândirea carnetului de şofer. Condiţii Din punct de vedere statistic. utilizată în scopuri de predicţie. evaluate anterior începerii cursului de statistică. Mai frecvent utilizată este regresia multiplă. care efectuează predicţii bazate pe mai multe variabile predictor asupra unei variabile criteriu.

urmând procedura prezentată mai sus. o astfel de procedură s-ar justifica mai ales pentru identificarea studenţilor cu potenţiale dificultăţi şi care. tocmai fiind avertizaţi în legătură cu aceste dificultăţi vor putea să acorde statisticii o atenţie sporită. Aceste valori confirmă existenţa unei legături pozitive semnificative.Procedura: În principiu. între cunoştinţele de matematică şi performanţa la statistică.47 - . Acesta ne spune că 54% din variaţia „performanţei la statistică” este explicată de variaţia valorilor la variabila „cunoştinţe de matematică”. 1 Facem precizarea că valorile şi aprecierile nu se bazează pe un studiu reale. în vederea obţinerii unui rezultat peste nivelul celui prezis. O idee mai exactă ne oferă coeficientul de determinare r2=0. ... implicită) Prediction interval (individual) va calcula limitele de încredere pentru valorile prezise. Deducem că restul de 46% din performanţa la statistică este explicată de alte variabile. Pe baza acestor concluzii se poate trece la analiza de regresie a cărei finalitate este aceea de obţinere a coeficienţilor a (termenul liber. În cazul nostru. bifăm Predicted Values-Unstandardized şi ResidualsUnstandardized. analiza de regresie începe cu coeficientul de corelaţie dintre variabile şi vizualizarea imaginii scatterplot. sau originea dreptei de regresie) şi b (panta dreptei de regresie).74 (p=0. Lansarea procedurii: Statistics-Regression-Linear.5476. am obţinut o corelaţie r=0. bifăm Estimates pentru crearea de variabile distincte în baza de obţinerea coeficienţilor de regresie (opţiune date. care vor avea ca efect În caseta Statistics.002). necunoscute în această fază1. cu ajutorul cărora se poate estima în viitor performanţa la statistică pe baza rezultatului la un test de cunoştinţe matematice aplicat în prima zi de şcoală. se trece variabila criteriu în zona Dependent iar variabila criteriu în zona Independent(s). În caseta Regression Save. Neîndoielnic. În caseta principală Linear Regression.

la fel ca şi pentru R2. Valoarea lui ne spune că 55% din variaţia performanţei la statistică este explicată de variaţia variabilei „cunoştinţe de matematică”. „Adjusted R Square” este o corecţie a lui R2 în funcţie de numărul de predictori şi numărul de subiecţi. se poate estima performanţă finală la statistică cu ajutorul relaţiei: . Valorile prezise sunt valorile rezultate pe baza modelului de predicţie. care este identic cu coeficientul de corelaţie dintre cele două variabile. Interpretarea este similară coeficientului de corelaţie simplă. Analiza rezultatelor Tabelul Model Summary oferă valoarea coeficientului de regresie. care este coeficientul de determinare al lui R. Tabelul Coefficients conţine coeficienţii B (nestandardizaţi) şi coeficientul beta (standardizat). de exemplu. în ecuaţia de predicţie. la alegere. dacă un student realizează un scor de 30 la testul de cunoştinţe de matematică.48 - .  Valorile reziduale se calculează ca diferenţă între valorile variabilei criteriu si cele prezise pe baza modelului de regresie. Dacă modelul de regresie ar fi avut mai multe variabile predictor. R ar fi fost coeficientul de corelaţie multiplă dintre predictori şi criteriu. notat cu R. care pot fi utilizaţi. Astfel.

să privim prima valoare prezisă de pe coloana pre_1 (25.406 + 0. Variabila res_1.41. Cu un nivel de încredere de 95% (echivalent cu o probabilitate de eroare de 0. atâta timp cât corelaţia dintre variabile nu este perfectă.77 şi 29. cu setările de mai sus.93 = 0. Sau.stat _ fin = a + b * mat _ in = 3. 0. Variabila pre_1. rezultatele conţin şi imaginea scatterplot a relaţiei dintre valorile mat_in şi scorurile z ale variabilei pre_1. conţin limitele inferioară şi superioară ale intervalului de încredere pentru fiecare valoare în parte. Pentru a înţelege mai bine problema limitelor.854 * 30 = 29. atunci: stat _ fin = beta * mat _ in = 0. aşa cum se vede în imaginea de mai jos.742 * 0. conţine diferenţa dintre valoarea reală şi valoarea prezisă Variabilele lici_1 şi lici_2. Desigur.05). putem spune că valoarea adevărată pentru stat_fin prezisă pe baza valorii mat_in=26. s-ar afla în intervalul 21. deoarece originea dreptei pentru scoruri standardizate se află în 0.598). Iar estimările conţin cu atât mai multă eroare cu cât corelaţia dintre variabile este mai mică (punctele graficului de corelaţie fiind mai îndepărtate de dreapta de regresie).406 este originea iar 0.02 unde 3.93). În fine. dacă predicţia se face pe baza unui scor standardizat z al variabilei mat_in (să zicem. scorurile astfel prezise sunt estimări. conţine valorile prezise pe baza modelului de regresie.69 În acest caz termenul liber are valoarea 0.854 este panta dreptei de regresie. . în baza de date apar câteva variabile noi.49 - . La finalul procedurii analizei de regresie.

punând în evidenţă abaterile de la modelul liniar. Acest lucru este cu deosebire util atunci când corelaţia este mică. Singura deosebire este dată de trasarea dreptei. în care.. Ce utilizăm. .Imaginea este identică cu ceea ce am prezentat în cazul corelaţiei. Dacă se alege alt model decât cel liniar (de exemplu.50 - . uşor de confundat.graficul este trecut deschis într-o fereastră individuală de editare.. Quadratic regression) se va obţine linia de regresie sub formă curbilinie. corelaţia sau regresia? Corelaţia şi regresia liniară sunt similare şi.se acţionează dublu clic de mouse pe imaginea graficului din Viewer.Fit Options. Facem precizarea că acest procedeu de trasare a liniei în interiorul scatterplotului este utilizabil şi în cazul corelaţiei. fapt care se poate datora faptului că relaţia dintre variabile nu urmează un model liniar (vezi exemplul din prima secţiune a manualului... de aceea. La capătul acestei serii de acţiuni apare caseta de mai jos unde se marchează Linear regression. Aceasta se face de către operator. prin care. În unele situaţii pot fi utilizate ambele proceduri. .se execută procedura Chart-Options-Fit Line. în felul următor: . . bazat pe corelaţia dintre scorurile z şi probabilităţile de sub curba normală).

calculele regresiei nu sunt simetrice. ca urmare. inversând variabilele în ecuaţia de regresie se va obţine o linie de regresie diferită. nu se calculează corelaţia Pearson) Se calculează regresia liniară: • atunci când una dintre variabile precede şi poate fi cauza celeilalte variabile • atunci când una dintre variabile este manipulată. se calculează regresia • atenţie. în timp ce dacă se inversează ordinea variabilelor în calcularea corelaţiei. se obţine acelaşi coeficient r. .Se calculează corelaţia liniară: • atunci când există două variabile măsurate pe aceiaşi subiecţi şi se doreşte evaluarea gradului de asociere între variabile • atunci când distribuţiile de eşantionare ale celor două variabile sunt normale (atunci când cel puţin una dintre variabile este manipulată.51 - .

Întrebarea cercetării este dacă femeile se uită într-o proporţie mai mare decât bărbaţii la telenovele. dintre care 5 femei şi 2 bărbaţi.. Procedura: Statistics-Non Patametric Tests-Binomial. Exemplu: La întrebarea „cine se uită la telenovele?” răspund DA 7 subiecţi. • Variabila testată este trecută în lista Test Variable List: .52 - . raportul femei/bărbaţi este cunoscut din studiile demografice (51%/49%) Aranjarea datelor Se creează variabila dihotomică cu valori numerice. valorile sunt 1 pentru feminin şi 2 pentru masculin. În cazul nostru. În cazul nostru.. este utilizat în cazul variabilelor dihotomice pentru a testa diferenţa dintre proporţiile valorilor în eşantion prin comparaţie cu proporţia la nivelul populaţiei.Teste neparametrice nominale Testul z al proporţiei pentru un singur eşantion Utilizare Testul z pentru proporţii pentru un eşantion. Variabilele de tip „string” nu sunt acceptate de procedura SPSS. Condiţii Cunoaşterea proporţiei la nivelul populaţiei pentru valorile variabilei testate.

243). . dacă variabila este dihotomică. prin raportare la proporţia lor în populaţie. În zona Test proportion se introduce proporţia primei categorii. Proporţia femeilor care se uită la telenovele nu diferă semnificativ de proporţia bărbaţilor. sau Cut point. Butonul Options permite solicitarea statisticii descriptive pentru variabila testată. prin fixarea unei valori care împarte distribuţia în două categorii. dacă variabila este continuă.• • • În zona Define Dichotomy se alege Get from data.53 - . În acest caz. se acceptă ipoteza de nul şi se respinge ipoteza cercetării. procentul şi semnificaţia testului în raport cu proporţia la nivelul populaţiei (p=0. Rezultate Rezultatul în cazul exemplului dat cuprinde frecvenţa pe categorii.

Aranjarea datelor Imaginea de mai jos conţine variabilele „inainte” şi „dupa”. nu sunt relevante sub aspectul procedurii SPSS. subiecţilor li se cere să memoreze cuvinte dintr-o listă. atunci numărul diferenţelor pozitive ar trebui să fie egal cu cel al diferenţelor negative. Ambele sunt prezentate numai pentru a face mai evident baza de calcul a testului deoarece. constituindu-se în pereche. perechea de variabile este trecută în lista Test Pair(s) List: prin acţionarea butonului ►. în Apoi.Testul semnelor Utilizare Testul semnelor este utilizat pentru a testa diferenţa dintre valori. conţine semnul diferenţei. Variabila „semn”. Cu cât numărul diferenţelor de un anumit semn este mai mare comparativ cu cel al diferenţelor de semn opus. se pot testa simultan mai . Dacă este necesar. care vor fi analizate. prin clic de mouse pe fiecare. Dacă nu se dispune de valorile variabilelor ci numai de semnul diferenţei.. În prima fază. în locul testului t pentru eşantioane dependente. 2. pe baza formulei 4.7. pe rând.. pentru a se putea face diferenţa lor. testul semnului va fi calculat manual. Exemplu: Într-un experiment cu privire la efectul motivării asupra memorării. Procedura: Statisstics-Nonparametric Tests-2 Related Samples.54 - . utilizându-se semnul diferenţei şi nu valoarea acesteia. Acest fapt se observă în partea de jos a casetei. cu atât creşte posibilitatea ca diferenţa dintre variabile să fie statistic semnificativă. Variabila „dif” conţine rezultatul diferenţei „dupa-inainte”. Condiţii Variabilele vor fi de tip numeric. înainte si după introducerea unui factor motivant. în fapt. iar valorile exprimate în aceeaşi unitate de măsură. atunci când ambele valori sunt măsurate pentru aceiaşi subiecţi . se alege testul semnului. Dacă nu ar exista nici o diferenţă între valorile perechi. cele două variabile sunt selectate. Dat fiind faptul că numărul subiecţilor este prea mic pentru asumarea normalităţii distribuţiei de eşantionare.

Se bifează Sign în zona Test Type.05. acceptându-se ipoteza cercetării (motivarea stimulează memorarea). este 0. În cazul nostru. Rezultate Tabelul Sign Test cuprinde numărul diferenţelor pozitive. Ipoteza de nul se respinge dacă valoarea lui p este mai mică decât pragul fixat şi care.016).zona Current Selections. implicit. ipoteza de nul se respinge. . respectiv negative. prezintă semnificaţia testului (p=0. În exemplul dat. există 7 diferenţe pozitive şi nici o diferenţă negativă. Tabelul Test Statistics. pentru cazurile din baza de date.55 - . multe perechi de variabile.

Testul Chi-pătrat al asocierii (independeţei) Utilizare Testul chi-pătrat este utilizat pentru evidenţierea gradului de asociere între două variabile categoriale. Este recomandabil ca frecvenţa aşteptată să nu ia valori mai mici de 5 (sau. iar datele sunt cele din următorul tabel de corespondenţă: PTSD Non-PTSD sex.. cel puţin.56 - . b. Sub forma unor înregistrări distincte pentru fiecare caz Acest mod poate fi extrem de dezavantajos atunci când sunt multe cazuri sau când există deja o statistică globală a fenomenului PTSD în raport cu sexul. Sub forma unor înregistrări distincte pentru valorile caracteristicii de sex: . Nici o celulă nu trebuie să aibă frecvenţa aşteptată 0. afectat de un cutremur de pământ. în nu mai mult de 20% din celule). Exemplu: Să presupunem că am evaluat numărul femeilor şi al bărbaţilor diagnosticaţi cu sindrom de stres postraumatic (PTSD) dintr-un mic oraş. Femei 20 30 Bărbaţi 10 40 Problema cercetării este dacă incidenţa PTSD este în legătură cu caracteristica de Aranjarea datelor Datele pot fi incluse în Data Editor în două moduri: a. Condiţii • Cele două variabile nu trebuie să se „intersecteze” (să nu existe subiecţi care să • • fie incluşi în mai mult de o celulă de tabel).

se va bifa şi Display clustered bar charts. Dacă de doreşte crearea unui grafic al corespondenţei dintre variabile.: Facem precizarea că în tabelele de date din imaginile de mai sus variabilele au fost codificate numeric cu 1 respectiv 2. se obţine prin setarea DataValue Labels. Rezultatul analizei nu depinde de modul de plasare a variabilelor pe linie sau pe coloană. Procedura: Statistics-Summarize-Crosstabs. valorile fiind etichetate. În caseta Cell Display se bifează Counts-Observed. respectiv Columns(s). atât pentru sex cât şi pentru PTSD. Pot fi analizate mai multe perechi de variabile simultan.. În caseta Statistics se bifează Chi-Square.. Percentages-Row. se apelează la procedura Data-Wheight Cases. Column.. Faptul că în celule apar etichetele şi nu valorile.57 - . se introduc frecvenţele PTSD pentru toate combinaţiile valorilor celor două variabile analizate şi frecvenţele asociate fiecăreia.  Procedura Chi-pătrat acceptă şi variabile de tip caracter (string) dar reamintim recomandarea de principiu ca toate variabilele să fie declarate de tip numeric. Pentru a se realiza corespondenţa dintre variabilele sex şi PTSD cu variabila frecv. Total şi Residuals-Unstandardized (bifarea opţiunilor este în funcţie de informaţiile pe care le doreşte analistul). .. Casetele de configurare sunt următoarele: • • • În caseta principală Crosstabs se trec variabilele analizate în lista Row(s).În această situaţie.

pragul de semnificaţie al acestuia (p=0.Rezultate Imaginea prezintă tabelul de corespondenţă.58 - . Vom exemplifica pentru celula „feminin/da”: • Count 20 indică numărul femeilor cu PTSD • %within Sex 40.000 care va fi citit ca p<0.0% indică procentul femeilor care au manifestat PTSD din totalul femeilor • %within PTSD indică procentul femeilor cu PTSD din totalul celor care au manifestat PTSD • % of Total indică procentul femeilor cu PTSD din totalul subiecţilor • Residual indică diferenţa dintre numărul de femei cu PTSD (frecvenţa observată) şi frecvenţa aşteptată (în cazul nostru.04) cu valoarea aferentă a pragului de semnificaţie: p<0. În celulele tabelului se află valorile solicitate prin configurarea casetelor.05. unde tabelul de corespondenţă este format din două linii şi două coloane. valoarea lui chi-pătrat poate fi luată de pe linia Continuitiy Correction (15. se respinge ipoteza de nul şi se confirmă ipoteza cercetării: există o incidenţă mai mare a reacţiei de stres postraumatic la femei decât la bărbaţi. Valoarea testului chi-pătrat fiind mai mică decât nivelul alfa 0.001).66) şi. în special.  În raportarea statisticii chi-pătrat va fi inclusă valoarea gradelor de libertate (df) şi numărul cazurilor . având pe linii valorile caracteristicii de sex iar pe coloane valorile aferente variabilei PTSD. +10) În tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16.001. În cazul particular al acestui exemplu.

la foarte bun şi dorim să ştim dacă distribuţia acestor calificative se supune curbei normale.. fie. Aranjarea datelor Vom exemplifica pe o situaţie corespunzătoare celui de-al doilea exemplu. dinainte cunoscute. prin înregistrarea rezultatelor sintetice şi ponderarea variabilei gen_muz cu variabila frecv prin operaţia Data-Weight cases. Valoarea lui chi-pătrat se raportează cu două zecimale Graficul de tip bară permite vizualizarea relaţiei dintre variabile.: . procentele aferente pe curba normală fiind cunoscute (2. de la foarte slab. Baza de date se poate constitui fie prin înregistrarea fiecărui caz în parte (având o variabilă pentru genul muzical şi o alta pentru exprimarea preferinţei faţă de acesta). presupunând că. Problema este dacă diferenţele dintre aceste frecvenţe sunt semnificative. Testul Chi-pătrat pentru corespondenţă (goodness of fit) Utilizare Testul chi-pătrat pentru gradul de corespondenţă se utilizează atunci când dorim să comparăm frecvenţele observate unei singure variabile categoriale cu frecvenţele aşteptate.5%). dacă ar fi trei genuri. 14%. 14%. Exemplul 1: Avem evaluarea nivelului de inteligenţă pe cinci categorii valorice.33%). ar trebui să fie identice (adică. 67%. fiecare ar trebui să întrunească un procent de 33. Exemplul 2: Am solicitat unui grup de tineri să îşi exprime genul muzical preferat şi am obţinut frecvenţe diferite pentru mai multe genuri de muzică.59 - .. 2. dacă nu ar fi semnificative proporţiile preferinţelor pentru genurilor muzicale.5%. ca în exemplul anterior.

. am fi bifat Values şi. • • • În caseta Chi-Square Test se trece variabila analizată în zona Test Variable List..Procedura: Statstics-NonParametric-Tests-Chi-Square.60 - . frecvenţele aşteptate şi valorile reziduale (diferenţa dintre frecvenţe) pentru cele trei genuri muzicale • Valoarea testului Chi-pătrat al corespondenţei (12.002 Acest rezultat justifică respingerea ipotezei de nul şi acceptarea concluziei că subiecţii diferenţele dintre preferinţele pentru cele trei genuri muzicale sunt semnificative şi nu se datorează variaţiei întâmplătoare de eşantionare.17). acesta fiind modelul în raport cu care dorim să testăm frecvenţele variabilei analizate Dacă am fi dorit să le testăm în raport cu alte frecvenţe cunoscute. apoi. df(2) şi p=0. Se bifează All categories equal.. am fi introdus pe rând acele frecvenţe (scriindu-le în dreptul lui Values şi înregistrându-le prin butonul Add) Rezultate Cele două tabele cu rezultate din Viewer prezintă: • Frecvenţele observate.

Sign up to vote on this title
UsefulNot useful