I.

3 Prezentare general SPSS for Windows2
SPSS sub Windows reprezint un pachet de programe interactiv, de utilitate general , destinat analizelor de date #i include multiple facilit &i #i tehnici de natur statistic . Pachetul de programe SPSS sub Windows reprezint o aplica&ie care folose#te întreaga func&ionalitate a sistemului

Figura 1.2 – Lansarea programului SPSS for Windows

Figura 1.3 – Fereastra logo SPSS for Windows

de operare Windows, reg sind în structura sa utilizarea mausului, ferestrele redimensionabile #i scalabile, meniuri derulante, casete de dialog etc. De#i majoritatea utilizatorilor vor fi complet satisf cu&i utilizând doar interfa&a grafic pe care SPSS o pune la dispozi&ie, totu#i pachetul de programe dispune #i de un puternic limbaj de comenzi prin care se pot realiza activit &i automate (scripturi) ce deter-

2

Pe parcursul acestei prezent ri, unele imagini sunt din SPSS 12.0 for Windows. Acest lucru nu incomodeaz în utilizarea altor versiuni. Toate imaginile utilizate reprezint marc înregistrat SPSS Inc.

Cristian Opariuc-Dan min eficientizarea ac&iunilor utilizate în mod frecvent sau efectuarea unor ac&iuni complexe, indisponibile în interfa&a grafic (SPSS, 2001). Programul SPSS, la fel ca orice alt aplica&ie sub sistemul de operare Windows, indiferent de versiunea acestuia, la instalare î#i creeaz un grup de pictograme (iconuri) în sec&iunea Programs a meniului Start din sistemul de operare Windows. Pentru a putea lansa în execu&ie aplica&ia, va trebui ca mai întâi s efectua&i clic cu maus-ul pe butonul start al desktop-ului Windows, buton situat de obicei în partea din stânga jos a ecranului. Apoi merge&i la sec&iunea Programs #i se va deschide o nou list care con&ine toate programele instalate în calculatorul dumneavoastr (ei bine, cel pu&in programele la care ave&i acces dumneavoastr ). În aceast list , c uta&i grupul de programe SPSS for Windows, grup în care ve&i g si pictogramele de lansare ale aplica&iei SPSS. Probabil c a&i identificat deja în acest grup de programe pictograma numit SPSS for Windows. Aceasta este imaginea pe care va trebui s face&i clic pentru a porni aplica&ia.3 SPSS este un program extrem de complex. Lansarea acestuia debuteaz cu prezentarea unei ferestre introductive, denumit #i fereastr „logo”. Ea cuprinde informa&ii despre versiunea programului (în cazul nostru, SPSS 12.0 Standard), deoarece exist #i versiuni server, mai complexe, versiuni demonstrative (ca aceea pe care o pute&i desc rca gratuit de la http://www.spss.com) sau „student” pentru înv &are etc., precum #i despre posesorul licen&ei de utilizare a acestui produs informatic. Se cunoa#te faptul c , în conformitate cu legea dreptului
Figura 1.4 – Fereastra introductiv

Desigur, în situa&ia în care SPSS for Windows este deja instalat pe calculatorul dumneavoastr . Dac nu ave&i instalat SPSS for Windows, pute&i desc rca o versiune demonstrativ de 30 de zile de pe site-ul http://www.spss.com Asigura&i-v c ave&i o conexiune suficient de rapid #i de stabil la Internet, deoarece fi#ierul este destul de mare (aproximativ 160 MB)

3

31

Statistic aplicat în #tiin&ele socio-umane

de autor #i protec&ia crea&iilor intelectuale, un produs software poate fi utilizat doar în cazul în care se posed o licen& de utilizare pentru acesta, altfel riscându-se pedepse severe, contraven&ionale sau de natur penal . Dup câteva secunde, fereastra de prezentare se dezactiveaz , iar aplica&ia prezint o interfa& prietenoas prin care ne invit s trecem la treab . Putem în aceast etap s lans m în execu&ie un program tutorial care ne va forma abilit &ile de baz în vederea utiliz rii acestui pachet informatic complex; de asemenea, putem trece direct la introducerea datelor sau putem rula o cerere predefinit , se poate crea o nou cerere de date sau se poate deschide o baz de date existent , situa&ie în care va trebui s preciz m loca&ia acesteia. Nu în ultimul rând, putem deschide o baz de date într-un alt format, de exemplu Excel, Statistica sau SAS, iar SPSS va #ti s converteasc aceste date pentru a le face disponibile. Exist , de asemenea, în Figura 1.5 – Fereastra principal SPSS partea de jos a acestui formular introductiv, o caset denumit „Don’t show this dialog in the future”. Dac o ve&i bifa, ave&i posibilitatea ca, la viitoarea lansare a produsului, s nu se mai afi#eze formularul, caz în care programul va trece direct în fereastra principal SPSS. Desigur, selectarea unei op&iuni dintre cele prezentate mai sus nu înseamn #i executarea acesteia de c tre SPSS. Pentru a lansa în execu&ie op&iunea aleas , va trebui ap sat, obligatoriu, butonul OK. Ap sarea butonului Cancel indic programului c trebuie s p r seasc formularul introductiv #i

32

acel buton în form de „X”. În acest moment. nu ne intereseaz niciuna dintre op&iunile predefinite. func&ionalitatea acestora se modific rela&ionat contextului în care ne afl m. în partea stâng a acesteia afi#ându-se mesajul Untitled – SPSS Data Editor. S privim cu aten&ie aceast nou interfa& cu utilizatorul. Ca orice alt aplica&ie Windows. prin intermediul c rora putem comanda SPSS #i putem efectua opera&iile #i prelucr rile de care acesta este capabil. De exemplu. desigur. În partea dreapt a barei de titlu. se afl meniurile. Bara de meniuri este urmat de bara de instrumente – mici butoane cu aspectul unor pictograme care. Acest mesaj ne informeaz c ne afl m în fereastra de date (editare a datelor) din SPSS #i c baza de date nu a fost înc salvat (în momentul salv rii. acest lucru îl vom face pe parcursul prezentului curs. Sub bara de titlu. SPSS prezint o bar de instrumente dinamic . SPSS posed o bar de titlu – bara albastr din partea de sus a ferestrei –. f când loc ferestrei principale SPSS. în general. adic aspectul butoanelor #i. dubleaz anumite func&ii din meniuri. astfel încât vom ap sa butonul Cancel.6 – Sec&iunea de editare a datelor lor analizelor de date. avem cele trei butoane clasice ale oric rei ferestre Windows: butonul de minimizare sau de transfer al aplica&iei în bara de sarcini. textul „Untitled” este înlocuit cu numele fi#ierului salvat pe disc). serii de etichete purtând fiecare un nume (în limba englez ). vom avea anumite butoane în modul de introducere a datelor #i alte butoane în modul de definire a variabilelor ori în modul de afi#are a rezultateFigura 1. butonul de maximizare – extindere a aplica&iei pe întregul ecran sau de restaurare a aplica&iei la dimensiunile ini&iale #i butonul de închidere a aplica&iei.Cristian Opariuc-Dan s lanseze fereastra principal SPSS în modul de lucru configurat pentru o nou baz de date. Iat c formularul prezentat mai sus a disp rut. Nu vom insista acum asupra explic rii tuturor meniurilor. func&ii mai des folosite. 33 .

Navigarea prin baza de date se poate face cu cele dou casete de derulare (numite #i lifturi sau controale de derulare). respectiv în partea de jos a ferestrei de date. informativ .7 – Marcatomutarea între modul de vizualizare a datelor dintr-o rii de sec&iune baz de date (sec&iunea Data View) #i modul de definire a variabilelor (sec&iunea Variable View). la rândul 8 al variabilei timp se afl valoarea 34). în SPSS. apare sec&iunea de editare a datelor. În partea de jos a programului SPSS. doi marcatori de sec&iune foarte importan&i: Data View #i Variable View. în partea din stângajos. #i sec&iunea de stare a procesorului SPSS unde se afi#eaz informa&ii refe- 34 . toate variabilele sunt denumite implicit „var”. Sec&iunea de date con&ine. partea din stânga.Statistic aplicat în #tiin&ele socio-umane Dup bara de instrumente. Liniile (înregistr rile) sunt identificate prin numere. Cea mai mare parte a ferestrei principale SPSS este dedicat sec&iunii de date. se afl bara de status cu dou sec&iuni: sec&iunea de informa&ii. Într-o baz de date „goal ”. în partea stâng . iar aceast denumire este scris cu culoarea gri. Observ m c datele. 8:time înseamn c suntem pozi&iona&i pe rândul 8 – a opta înregistrare – a variabilei timp). iar coloanele reprezint variabilele. situate în partea dreapt . unde se afi#eaz scurte instruc&iuni despre diferitele func&ii ale meniurilor sau ale barei de instrumente. Aceasta este format dintr-o parte needitabil . pe linii #i coloane. reprezentând faptul c acestea nu au fost înc definite. sunt organizate tabelar. Partea editabil arat întotdeauna valoarea acestei variabile în pozi&ia specificat (în cazul nostru. Formatul acestui identificator este un num r urmat de dou puncte #i apoi numele variabilei (spre exemplu. Aceste elemente permit coFigura 1. cum ar fi foile de calcul tabelar (Excel) sau bazele de date (FoxPro sau Access). analog altor aplica&ii mai cunoscute. în care se afi#eaz în permanen& pozi&ia celulei active (celul pe care am selectat-o). la fel ca în orice program Windows.

fie folosind meniul File #i apoi Exit. este momentul s vedem cum putem deschide o baz de date existent #i care sunt elementele componente ale acesteia. P r sirea programului SPSS se poate face fie ap sând butonul de închidere al aplica&iei „X” din col&ul din dreapta sus al ferestrei principale. În general. începerea unei prelucr ri statistice se poate face doar în condi&iile în care vede&i mesajul SPSS Processor is ready în aceast sec&iune. discut m în subcapitolul urm tor. Deschiderea unei baze de date în scoFigura 1. programul v va solicita mai întâi salvarea documentului.1 Bazele de date – creare. deschidere Dup ce ne-am familiarizat cu interfa&a programului SPSS.Cristian Opariuc-Dan ritoare la rularea unor sarcini mari consumatoare de timp. Pe parcursul acestor exerci&ii. Apare o list de unde putem deschide o baz de date (Data).8 – Deschiderea pul efectu rii prelucr rilor statistice se poate unei baze de date face prin mai multe metode. îns . din ra&iuni de compatibilitate. aceste exemple de baze de date oferite de c tre produc torii programului SPSS. ca m sur de protec&ie împotriva pierderii de informa&ie. o procedur de sintax 35 . Prima metod este aceea prin care apel m la meniul File (Fi#ier) #i apoi pozi&ion m cursorul maus-ului pe submeniul Open (Deschide). SPSS vine înso&it de o serie de baze de date demonstrative în scopul facilit rii procesului de înv &are.3. vom folosi. Despre salvare. salvare. I. r mânând la latitudinea dumneavoastr #i potrivit experien&ei pe care o ave&i s alege&i metoda care v convine mai mult. Dac a&i f cut prelucr ri de date sau modific ri în baza de date.

Ultima metod se refer la folosirea barei de instrumente pentru a deschide o baz de date. O „tast fierbinte” este o tast folosit în combina&ie cu tasta Alt. va trebui selectat op&iunea Data. notarea acestei combina&ii se face folosind conven&ia Alt+F. pentru a deschide o baz de date. apoi Open #i apoi Data. Observa&i c fiecare dintre aceste op&iuni este urmat de puncte de suspensie (…).numitelor „taste rapide”. un set de comenzi (Script) sau un alt tip de fi#ier (Other). putem pur #i simplu s &inem ap sat tasta Ctrl în timp ce ap s m tasta O (de la Open). A treia metod apeleaz la numitele „taste fierbin&i” (hot-keys). dac dori&i. în meniul File este subliniat litera F. ve&i putea observa c unele litere sunt subliniate – de exemplu. avantajul fiind acela c este mult mai rapid . . iar. Adic se va deschide o nou fereastr . meniurile sunt înso&ite de combina&ii de taste prin care pute&i efectua direct o anumit sarcin .Statistic aplicat în #tiin&ele socio-umane (Syntax) o foaie de rezultate (Output). acela care are aspectul unui dosar deschis. Întotdeauna când ve&i întâlni aceste puncte de suspensie al turi de o comand Windows (nu doar în SPSS.inând ap sat tasta Alt #i ap sând apoi tasta F. Alt+A – accesarea op&iunii Data. putem folosi combina&iile Alt+F – deschiderea meniului File #i apoi Alt+O – deschiderea submeniului Open. în final. nota&ie pe care o vom folosi pe întreg parcursul acestui curs. ca #i când am efectua clic pe acesta. 36 . De obicei. O alt metod prin care pute&i deschide o baz de date este folosirea a#a. va trebui s #ti&i c acea comand v invit la dialog. de unde va trebui s alege&i ceva sau s furniza&i anumite informa&ii programului pentru a putea executa comanda respectiv . În mod analog. Deci. Pentru a deschide o baz de date. vom ob&ine deschiderea meniului File. ci #i în orice program Windows). Dac ve&i privi cu aten&ie meniurile. Pur #i simplu ap sa&i pe primul buton de pe bara de instrumente. o navigare prin meniuri f r maus. În loc s apel m la meniul File. O astfel de combina&ie se noteaz prin Ctrl+O. Vom observa c aceast combina&ie are acela#i efect ca #i parcurgerea primei metode. Aceasta este.

Cel de-al treilea buton permite crearea unui nou director în directorul curent. Al doilea buton. S analiz m pu&in aceast nou fereastr . Al turi de caseta Look in. butonul este inactiv.Cristian Opariuc-Dan Indiferent de metoda folosit . efectul va fi acela#i: deschiderea unei casete de dialog. din care pute&i alege baza de date pe care o ve&i înc rca (v mai aminti&i nota referitoare la punctele de suspensie?). iar în sec&iunea de sub Figura 1. 37 . Primul buton. Pute&i astfel selecta orice director în care ave&i fi#iere recunoscute de SPSS. cel de forma unei s ge&i orientate în partea stâng . ap sând acest buton ve&i reveni din nou în directorul SPSS. vom putea alege directorul în care este localizat baza noastr de date. Observ m c directorul curent este directorul aplica&iei (SPSS). denumire pe care o ve&i putea modifica dup dorin& . mic. permite navigarea la ultima ac&iune efectuat . ultimul buton controleaz modul în care se afi#eaz pictogramele în caseta central . deoarece nu a&i efectuat înc nici o ac&iune care s fie înregistrat . La o prim ap sare. La prima deschidere a acestei casete de dialog. În partea de sus avem o list derulant intitulat Look in: Ap sând s geata orientat în jos din partea dreapt a acestei casete. permite navigarea ascendent prin arborele de directoare. din directorul SPSS v-a&i pozi&ionat pe directorul Windows. ve&i putea crea un nou director. numit New Folder. Dac . la urm toarea v ve&i situa în directorul r d cin C #i a#a mai departe. v ve&i deplasa în directorul Program Files. de exemplu. se afl o serie de butoane care controleaz navigarea prin structura de directoare de pe discul dumneavoastr . În sfâr#it. Pute&i alege vizualizarea pictogramelor în format mare.9 – Fereastra de selectare a fi#ierului în vederea deschiderii aceast caset este afi#at con&inutul acestui dosar. Ap sând pe el. pentru a le putea afi#a #i/sau deschide. sub form de list sau list detaliat . de forma unui dosar cu o s geat orientat în sus.

sav. vom înc rca baza de date „Cars” din directorul implicit SPSS. situat pe tastatur . variabila „Filter_$” este o variabil intern folosit de programul SPSS pentru o filtrare anterioar a datelor. Dac efectua&i doar un simplu clic. iar variabila a fost eliminat împreun cu toate datele 38 . adic fi#ierele care con&in baze de date SPSS. observ m c s-a modificat aspectul ferestrei principale SPSS. constat m c structura acesteia este compus din opt variabile. ap s m tasta Delete. iar SPSS va afi#a doar fi#ierele ce au aceast extensie.Statistic aplicat în #tiin&ele socio-umane Fereastra central afi#eaz . Pute&i efectua dublu clic pe numele unui director pentru a afi#a con&inutul acestuia sau pe numele unui fi#ier pentru a-l deschide în mod direct (f r a mai ap sa butonul Open). sunt afi#ate doar fi#ierele cu extensia . fie efectuând dublu clic pe numele fi#ierului.sav. Dup deschidere. În continuare. mesaj ce ne informeaz c am deschis baza de date „Cars” #i c ea este preg tit pentru analiz . de#i directorul SPSS con&ine mai multe fi#iere. baz de date ce reprezint un inventar al diferitelor tipuri de ma#ini #i al caracteristicilor acestora. Dac o vom deschide. numele fi#ierului selectat va fi afi#at în caseta File name #i va trebui s folosi&i apoi butonul Open pentru a-l deschide. De asemenea.xls) sau dBase (. efectuând clic pe s geata orientat în jos din partea dreapt a acesteia. Deschiderea propriu-zis a unui fi#ier se face fie efectuând clic pe acesta #i ap sând butonul Open. vom putea alege ce anume tip de fi#iere s se afi#eze în sec&iunea central . de exemplu formatul Excel (.dbf). Ultima variabil . Putem alege alte extensii de fi#iere care sunt afi#ate. dup cum am men&ionat. Spre exemplu. variabil pe care ne propunem s o #tergem. în bara de titlu a ap rut mesajul Cars – SPSS Data Editor. Caseta derulant Files of type reprezint un filtru pentru fi#ierele afi#ate. În primul rând. structura de subdirectoare #i fi#iere a directorului curent. Observ m c . deoarece în aceast caset de filtrare s-a ales extensia . fiecare dintre ele reprezentând o anumit caracteristic a ma#inilor. Observ m c întregul con&inut al coloanei „Filter_$” s-a selectat. Cum? Efectuând clic pe numele acesteia. în partea dreapt a grupului principal de taste.

Din p cate. 39 .Cristian Opariuc-Dan acesteia. Dac vom efectua clic pe sec&iunea Variable view. Vom clarifica imediat. unde putem interveni asupra structurii lor interne. Iat #i prima dumneavoastr interven&ie real în SPSS. îns nu se permite includerea spa&iilor sau a altor semne de punctua&ie în denumirea acestora #i de aceea va trebui s fim foarte restrictivi în momentul în care le cre m. Ca s folosim un limbaj mai tehnic. ce accept maximum 4 caractere (adic cifre între 0 #i 9999) #i f r zecimale. Astfel. Figura 1. Felicit ri. în Variable view ne afl m în sec&iunea meta-datelor.0 în sus accept nume de variabile cu mai mult de 8 caractere. aici putem vizualiza #i edita denumirea. tipul #i alte informa&ii referitoare la variabile. vom intra în modul de definire a datelor. doar versiunile de SPSS de la 13. denumit „mpg” este o variabil numeric . Nici noi nu puteam face excep&ie! Baza de date deschis de c tre dumneavoastr a fost afi#at în sec&iunea Data view. fapt care ne atrage aten&ia c în acest mod putem afi#a #i urm ri con&inutul datelor din baza de date. prima variabil . Dup cum ne spune #i numele sec&iunii. dac în Data view ne afl m în sec&iunea datelor propriu-zise. Dup cum bine #tim. orice prim interven&ie într-un program înseamn o „#tergere a ceva”. prin câteva exemple. Pentru a în&elege mai u#or la ce anume se refer o anumit variabil .10 – Sec&iunea de definire a variabilelor Numele „mpg” nu este îns un nume intuitiv #i nu ne putem da seama cu precizie la ce se refer aceast variabil . aceste aspecte. adic în sec&iunea informa&iilor despre date.

a&i observat c . numele va r mâne acela#i. fie o caset de selec&ie – s geata orientat în jos – prin care pute&i deschide o list . avem. nu folosi&i litera #. Vom da clic în sec&iunea Label. Iat . eticheta variabilei ne informeaz c „mpg” se refer la „Miles per Gallon”. Exerci iu practic: În exerci&iul care urmeaz vom traduce pur #i simplu în române#te structura acestei baze de date #i vom salva baza de date sub un nou nume. de asemenea. prin urmare. ci s. alinierea datelor în cadrul celulelor #i definirea tipului de variabil – nominal . nu folosi&i diacriticele române#ti în scrierea literelor. În cazul nostru. valoarea 2 pentru cele de produc&ie european #i valoarea 3 pentru cele japoneze. posibilitatea de a controla modul de tratare a cazurilor lips . În spa&iul destinat definirii variabilelor. 40 . iar noi vom modifica doar descrierea. „Masini” (aten&ie. uneori. Efectuând clic pe aceste sec&iuni. în cazul variabilei „origin”. Deci nu vom salva cu „Ma#ini”. ordinal #i scalar . într-un director nou creat având calea „C:\Exercitii SPSS” (aceea#i men&iune referitoare la diacritice). adic la consumul automobilului exprimat în distan&a pe care acesta o poate parcurge cu un galon de combustibil. adic de a include un text descriptiv asociat numelui ei.Statistic aplicat în #tiin&ele socio-umane avem posibilitatea de a o eticheta. care se refer la &ara de produc&ie a ma#inilor. respectiv mic#ora o anumit valoare. observ m c s-a asociat valoarea 1 pentru ma#inile de produc&ie american . apare în partea dreapt a acestora fie un buton cu punctele de suspensie care va deschide o caset de dialog unde se pot controla parametrii valorilor acceptate. în acest caz. fie un buton de incrementare/decrementare cu ajutorul c ruia pute&i m ri. acolo unde se afl afi#at textul „Miles per Gallon” #i vom scrie textul „Mile per galon”. În cazul primei variabile. de unde s selecta&i anumite valori. Urm toarea sec&iune prezint valorile pe care le putem defini pentru respectiva variabil . ci „Masini”).

Vorbeam anterior despre ma#ini de produc&ie american . Aten&ie. Constat m c . l sând traducerea din englez în român la latitudinea dumneavoastr . „Capacitate cilindric ”. în caseta Value a ap rut cifra 1. exist 3 butoane: Add cu ajutorul c ruia putem crea o nou asociere. Ap sând acest buton se deschide o nou fereastr . s-a activat butonul Remove. îns . De asemenea. iar în caseta Value Label textul „American”. Danivel nominal #i ordinal c vom da clic pe celula corespunz toare coloanei Values pentru aceast variabil . 3. la acel maximum de 8 caractere când redenumi&i o variabil . pe care o ve&i modifica dup exemplul primei variabile. O vom redenumi „origine” #i vom modifica. Change prin care putem modifica o asociere selectat #i Remove care #terge. 5 #i 6. Vom efectua clic pe prima asociere 1 = „American”. În aceast caset vedem lista acestor asocieri în partea de jos. Putem deduce cu u#urin& c valorii 1 i s-a asociat textul „American”(apropo. Variabila num rul 7 se refer la &ara de origine a ma#inilor.Cristian Opariuc-Dan A doua variabil se nume#te „engine”.11 – Etichetarea variabilelor de le americane. 4. europene #i japoneze. european #i japonez . În stânga listei. pentru a doua variabil . efectu m clic 41 . Noi ne-am propus s traducem aceast structur de date în limba român . V mai aminti&i probabil de ma#iniFigura 1. SPSS presupunând c dorim s elimin m aceast asociere din moment ce am selectat-o. Exist îns . Pentru a modifica textul. #i anume coloana Values. Proced m la fel în cazul variabilelor 2. f când clic în coloana Name #i scriind noul nume. eticheta. constat m apari&ia unui mic buton cu puncte de suspensie în partea dreapt a celulei. desigur. Eticheta va deveni. fereastra de configurare a valorilor asociate. la ce nivel de m surare ne afl m aici #i ce fel de variabil este aceasta?). elimin asocierea selectat . Vom schimba numele acesteia în „cilindree” (ne-am încadrat în 8 caractere). automat. la acest nivel. un element în plus.

#tergem un „n”). ap sa&i butonul OK pentru a le memora #i a p r si formularul. în final. În continuare. De ce s folosim aceste asocieri în loc de a scrie pur #i simplu în baza de date „America”. Felicit ri. de#i 1. SPSS depistând modificarea efectuat #i presupunând c vom dori s o #i aplic m efectiv. se preteaz mult mai bine la prelucr rile statistice ulterioare. la ce anume se refer 1. Europa #i Japonia. În al doilea rând. Imagina&i-v c ave&i de introdus un num r de 3000 de date în baza dumneavoastr de date. Prin acest exerci&iu. referitoare la num rul de cilindri ai motorului. 2 #i 3 sunt doar ni#te etichete pentru America. oricând pute&i include o nou asociere. de fiecare dat . se activeaz #i butonul Change. „America” (mai bine spus. 2 când v referi&i la Europa #i 3 când v referi&i la Japonia. în urma asocierilor realizate în etapa anterioar . ve&i tasta pur #i simplu 1 atunci când v referi&i la America. Proceda&i la fel #i cu ultima variabil .Statistic aplicat în #tiin&ele socio-umane în interiorul casetei Value Label #i scriem în loc de „American”. vom salva baza de date modificat sub 42 . Dac ve&i ap sa acest buton (Change). s ob&ine&i structura complet a bazei de date. SPSS va #ti. 2 #i 3. fiind date numerice. Apare totu#i o întrebare. În momentul în care a&i terminat de efectuat toate asocierile. „Europa” #i „Japonia”? În primul rând. apoi ap sa&i butonul Add care a&i observat c a devenit activ. A&i realizat prima traducere. De data aceasta. În loc s scrie&i de fiecare dat un text format din 6-8 caractere. ne-am deprins cu unele elemente ale configur rii structurii bazei de date. Tasta&i cifra 4 în caseta Value (deoarece ar urma 4 în ordine logic ) #i textul „România” în caseta Value Label. pentru c este mai u#or. pentru ca. ve&i constata c eticheta s-a modificat din 1 = American în 1 = America. Re&ine&i c ap sarea butonului Cancel duce la p r sirea formularului f r memorarea asocierilor. Astfel a&i asociat valoarea 4 ma#inilor de produc&ie româneasc . Acum proceda&i la fel pentru „Europa” #i „Japonia”. Desigur.

Folosind cuno#tin&ele dobândite anterior. pute&i ap sa combina&ia de taste Ctrl+S sau Alt+F.Cristian Opariuc-Dan denumirea de „Masini”. cu excep&ia butonului Open. în acest caz denumirea acestuia fiind Save. deci nu vom putea folosi decât op&iunea Save as (Salveaz ca). Se va deschide caseta de salvare a unei baze de date care are acela#i aspect ca #i caseta de deschidere a unei baze de date. s crea&i un nou director folosind butonul de creare a unui director din acest formular pe care s -l denumi&i Exerci&ii SPSS. care ne informeaz c programul a salvat cu succes baza de date pe disc #i a activat-o. A&i reu#it. butonul de pe bara de instrumente sau 43 . nu-i a#a? În urma acestor opera&iuni. la crearea unei noi baze de date. Reamintim faptul c . Noi ne-am propus s salv m baza de date sub un alt nume #i într-un alt loc. în bara de titlu SPSS va ap rea mesajul Masini – SPSS Data Editor. va trebui s v pozi&iona&i cu ajutorul casetei Figura 1. folosind Save. Alt+S sau pute&i ap sa butonul de salvare de pe bara de instrumente (acela care are o dischet drept pictogram ). în cazul nostru baza de date „Cars”. Directorul folosit va fi „C:\Exercitii SPSS” (aten&ie la diacritice!). Dar aten&ie! Diferen&a dintre op&iunea Save #i Save as este aceea c . folosirea oric ror op&iuni de salvare (meniul File. Pute&i alege meniul File #i op&iunea Save sau Save as. s efectua&i dublu clic pe acesta pentru a-l deschide #i s introduce&i numele bazei de date Masini în caseta File name. se vor salva modific rile efectuate tot în baza de date ini&ial .12 – Fereastra de salvare a Save in (echivalenta casetei Look in unei baze de date din fereastra de deschidere a bazei de date) în directorul r d cin C:\. Ap sa&i apoi butonul Save pentru a salva efectiv fi#ierul pe disc.

Crearea unei noi baze de date se poate face folosind meniul File. Odat salvat baza de date. Exist dou defini&ii de asocieri. v propunem crearea unei noi baze de date având urm toarea structur #i salvarea acesteia sub numele de „IQ” în directorul C:\Exercitii SPSS”: Variabila „nume” va fi de tip #ir de caractere (string) #i va stoca numele subiec&ilor. folosind cuno#tin&ele dobândite. Alt+A. Ca exerci&iu. Alt+N. Bazele de date noi sunt identificate prin mesajul Untitled – SPSS Data Editor. Singura modalitate prin care putem da un alt nume bazei de date sau prin care o putem salva într-un alt loc este folosirea op&iunii Save as. deoarece fiind o baz de date nou . SPSS va crea o baz de date goal #i nedefinit . În oricare dintre aceste situa&ii. f r a mai ap rea fereastra de salvare de mai sus. la lansarea programului SPSS. A&i observat c . #i anume variabila „sexul” (1-Masculin 2-Feminin) #i „scoala” (1-Primare 2-Gimnaziu 3-Liceul 4-Postliceala 5-Facultate) 44 . submeniul New #i op&iunea Data. toate celelalte variabile fiind numerice. combina&iile de taste Ctrl+N sau Alt+F. orice modific ri efectu m în ea. acesteia nu i-a fost atribuit înc un nume printr-o opera&ie de salvare. urm rind bara de titlu. în timp ce bazele de date salvate au afi#at numele acestora în bara de titlu. Pute&i cu u#urin& identifica dac o baz de date are un nume (a fost salvat ) sau nu. acesta creeaz automat o baz de date nou #i nedefinit #i a#teapt din partea noastr definirea variabilelor #i salvarea acesteia.Statistic aplicat în #tiin&ele socio-umane tastele rapide) duce la apari&ia ferestrei Save as. la fel ca în cazul lans rii programului. la salvare ele vor fi scrise automat în fi#ierul al c rui nume este afi#at în bara de titlu.

Numele variabilei reprezint modul în care aceasta va fi apelat în toate prelucr rile efectuate folosind baza de date. am remarcat deja prezen&a a zece caracteristici prin care se poate defini o variabil în SPSS. caracteristic pe care nu am abordat-o în detaliu în timpul prezent rii noastre de pân acum. fiind acceptat de SPSS. Nu putem îns s nu preciz m c SPSS impune o serie de restric&ii în denumirea variabilelor (versiunile mai mici de versiunea 13): în primul rând. numele acestora s nu dep #easc 8 caractere. Aceast sec&iune con&ine un buton cu trei puncte de suspensie. dac avem o variabil care se refer la anul na#terii. ne vom folosi de baza de date „IQ” creat #i salvat în exerci&iul anterior. De exemplu. Apoi. fiind definite cinci nume de variabile: numele. scoala #i iq. putând fi îns folosit linia de subliniere pentru cazurile în care dorim s abreviem o variabil format din dou cuvinte. sexul. Pentru aceasta. Folosind cuno#tin&ele teoretice acumulate. baza noastr de date IQ nu creeaz probleme. în final. variabilele cu nume mai lungi de 8 caractere nefiind acceptate. fapt de asemenea acceptat de SPSS. Nu conteaz dac scriem numele variabilelor cu litere mari sau cu litere mici. caracteristic ce nu presupune prea multe explica&ii. În sec&iunea Data View. deoarece. varsta. o vom putea abrevia denumind-o an_naste. SPSS le converte#te automat în litere mici. A doua caracteristic se refer la tipul de date ce va fi stocat în aceste variabile (Type). preciza&i tipul fiec rei variabile create în acest exerci&iu. proceda&i la salvarea fi#ierului în locul precizat. lungimea ei este de 8 caractere. pe care îl putem ap sa pentru a deschide fereastra de 45 . iar cele dou cuvinte componente le-am separat printr-o linie de subliniere. Ne propunem în continuare aprofundarea definirii variabilelor în SPSS. Astfel. Din punctul de vedere al primei caracteristici. nu pot fi folosite spa&ii sau semne de punctua&ie în denumirea variabilelor. Prima dintre acestea se refer la numele variabilei (Name).Cristian Opariuc-Dan Dup construirea structurii de date.

num rul maxim de caractere 3 #i 2 caractere zecimale înseamn c acea variabil poate stoca valori numerice de la 0 pân la 999. Este. De exemplu. putem stabili #i dimensiunea acestora – valoarea maxim pe care SPSS o poate accepta – prin Figura 1.999. Valorile acceptate vor fi. dup cum urmeaz : Tipul de date „Numeric” – se refer la numere. în format standard.89 În acest caz recunoa#tem formatul românesc. numai c acestea vor fi afi#ate folosindu-se virgula ca separator între valoarea sutelor #i valoarea miilor #i punctul ca separator al valorilor zecimale. Un exemplu de num r scris în acest format ar fi 78457845. Modul 46 . practic. folosind litera E pentru a reprezenta puterile lui 10. Alegând acest tip de date. Aceasta con&ine o serie de butoane de op&iuni.13 – Stabilirea tipului de date precizarea num rului de caractere a unei variabile în câmpul Width #i num rul de caractere dup virgul în câmpul Decimal Places. De exemplu.999.Statistic aplicat în #tiin&ele socio-umane configurare a tipului de date.99. numere. o valoare numeric în acest format ar ar ta astfel: 9. Reluând acela#i exemplu. num rul de mai sus va fi scris astfel: 9. Tipul de date „Scientific notation” – se refer la modul #tiin&ific de afi#are a cifrelor. formatul numeric clasic american. la numere #i pot fi definite la fel ca tipul anterior. deci.57 Tipul de date „Comma” – se refer . dintre care putem selecta tipul de date pe care variabila noastr îl va stoca. doar c se inverseaz rolul punctului #i al virgulei.89. de asemenea. Acest tip de date va scrie valorile numerice f r nici o separa&ie între sute #i mii #i folosind ca separator zecimal separatorul configurat al sistemului. Tipul de date „Dot” – identic cu tipul de date anterior.

elemente pe care le-am discutat anterior. la fel ca la tipul anterior. Tipul de date „Custom currency” – permite definirea unor valori monetare particularizate. iar un exemplu de num r folosind aceast reprezentare poate fi 1. Se poate defini forma de prezentare a variabilei #i valoarea maxim acceptat . cu alte cuvinte texte. valabile pentru alte & ri în afara Statelor Unite. În cazul nostru.Cristian Opariuc-Dan de configurare a dimensiunii variabilei este acela#i. la fel ca în cazul valorilor numerice.00. va trebui s configura&i. 47 . f r nici o posibilitate de prelucrare statistic . Caracteristica a treia #i caracteristica a patra a unei variabile.14 – Tipul de date calendaristice Tipul de date „Dollar” – se refer la valori monetare. iar aceste dou caracteristici nu fac decât s creeze o alt posibilitate de definire a variabilelor sub acest aspect. respectiv Width #i Decimals se refer exact la valorile maxime pe care le pot accepta variabilele #i la num rul de zecimale. avându-se în vedere moneda american . Figura 1. Tipul de date „Date” – se refer la date calendaristice. modul de afi#are a datei calendaristice dintr-o mul&ime de formate care vi se ofer .23E2 ceea ce semnific de fapt 123. Alegând aceast op&iune. Poate fi definit #i aici dimensiunea maxim pe care o poate avea variabila din punctul de vedere al num rului de caractere acceptate. Pute&i alege #i particulariza valoarea maxim pe care o poate accepta variabila din lista ce se afi#eaz sau pute&i particulariza aceast valoare. variabila „nume” este un exemplu excelent de variabil de tip string. selectând din lista ce se va deschide. Tipul de date „String” – stocheaz doar #iruri de caractere.

cunoscându-se faptul c datele de tip string nu pot fi interpretate statistic. Dac crea&i un tabel de frecven& . „Coeficientul de inteligen& ”. Deci aten&ie la scrierea romanelor în descrierea variabilelor!!! Aceast caracteristic mai are îns o func&ie important . SPSS include eticheta variabilelor în rapoartele finale rezultate în urma prelucr rii datelor. deci. permite includerea unei denumiri mai intuitive a variabilei. variabila „nume” care poate accepta maxim 20 de caractere. toate celelalte variabile fiind de tip numeric. vârsta poate lua valori de pân la 999. f când astfel mult mai estetice #i mai inteligibile foile de raport. variabilele „sexul” #i „#coala” pot accepta doar o singur cifr f r zecimale. SPSS nu va afi#a numai numele variabilei. cu condi&ia ca lungimea acesteia s nu dep #easc 255 de caractere. pentru scopurile noastre. acela#i lucru fiind valabil #i pentru coeficientul de inteligen& .Statistic aplicat în #tiin&ele socio-umane În cazul exemplului nostru. iar variabilele „varsta” #i „iq” pot accepta 3 cifre f r zecimale. pentru a putea introduce 48 . ci va include #i descrierea acesteia. Urm toarea caracteristic . caracteristica Label. de exemplu „iq”. Putem include orice etichet descriptiv dorim pentru numele unei variabile. deoarece am convenit s asociem valoarea 1 cu sexul masculin #i 2 cu sexul feminin. variabila „iq” o putem eticheta drept „Coeficientul de inteligen& ” #i a#a mai departe. Spre exemplu. suficient. în mod analog procedând #i cu nivelul de #colarizare. prin care s poat fi mai u#or identificat #i recunoscut . Aceast defini&ie permite stocarea subiec&ilor cu numele format din maxim 20 de litere. constat m c avem o singur variabil de tip string. putem asocia valoarea 1 sexului masculin #i valoarea 2 sexului feminin. Datele au fost definite ca numerice pentru a crea posibilitatea interpret rii lor ulterioare. Caracteristica Values am discutat-o pe larg în sec&iunile anterioare #i nu vom mai reveni asupra ei. Men&ion m doar c ea permite clasific ri (deci variabile categoriale) #i asocieri de valori. Sexul #i nivelul de #colarizare accept doar o singur cifr . variabilei „nume” îi putem da eticheta „Numele subiec&ilor”. Astfel.

în care putem stabili un interval pentru care valorile vor fi tratate ca valori lips (spre exemplu. vom include cifra 2 în prima dintre cele trei casete ale acestei sec&iuni.Cristian Opariuc-Dan mai u#or datele #i pentru a putea efectua prelucr ri statistice la nivel de variabile nominale.) #i situa&ia „Range plus one optional discrete missing value”. se refer la codificarea r spunsurilor de tip „Nu #tiu/Nu r spund”. faptului c subiectul refuz s r spund la o anumit întrebare sau fapFigura 1. r spunsul 2 fiind tratat ca non-r spuns. Datele lips se pot datora. Majoritatea cercet torilor codeaz aceste variante cu 9 sau 99. spre exemplu. este important s cunoa#tem de ce lipsesc valori dintr-o variabil . acestea fiind tratate ca atare în cursul fiec rei prelucr ri de date pe care o realiz m. coeficien&ii de inteligen& cuprin#i între 10 #i 75). Iat dou situa&ii care ar necesita un tratament separat al valorilor lips . Un alt exemplu. când comunic m programului c nu dorim un tratament special pentru valorile lips .15 – Tratarea valorilor lips tului c întrebarea nu este adresat acelui subiect. situa&ia „Discrete missing values”. în plus existând posibilitatea de 49 . fiind ini&ial excluse din cele mai multe calcule. Evident. Definirea valorilor lips poate accepta trei situa&ii. SPSS eliminându-le din analiz . Folosind aceast sec&iune se pot include aceste valori (9 sau 99) ca valori lips . frecvent întâlnit în chestionarele sociologice. Situa&ia „No missing values”. variantele incerte nu vor face obiectul prelucr rii ini&iale a datelor. când putem defini pân la trei valori care vor fi tratate ca valori lips în cursul prelucr rilor statistice ulterioare (de exemplu. Pentru aceasta. Uneori. dorim ca doar r spunsurile 1 #i 3 s fie luate în calcul. Caracteristica Missing permite definirea modului în care vor fi tratate valorile lips din cadrul unei variabile. la un chestionar cu 3 variante de r spuns. Datele pe care le ve&i trata în mod explicit ca date lips pot fi supuse apoi unei analize statistice separate.

Implicit. afi#ându-se doar primele 8 caractere #i anume „Popescu ”. permi&ând alegerea nivelului de m surare al variabilei. În cazul nostru. Se poate opta pentru dou sau trei niveluri de m surare. în func&ie de tipul de variabil . f r a influen&a în vreun fel modul de prelucrare al variabilelor. pentru variabila „nume”. centrare sau aliniere la dreapta a valorii variabilelor în cadrul coloanelor din Data View. dimensiunea implicit de 8 caractere va fi insuficient pentru prezentarea unui subiect cu numele „Popescu Valentin”. Measure. fie trage&i cu ajutorul maus-ului linia de demarca&ie dintre coloana „nume” #i coloana „varsta”. variabilele de tip string se aliniaz la stânga. ca #i în situa&ia anterioar . nu avem nici un motiv de a trata în vreun fel valorile lips . este în acela#i timp #i una foarte important .Statistic aplicat în #tiin&ele socio-umane a include #i o valoare particular (discret ). Putem include aici o alt valoare sau putem redimensiona l &imea coloanelor în modul Data View. ca #i urm toarea. Astfel. iar variabilele de tip numeric sau dat calendaristic se aliniaz la dreapta pentru o mai bun lizibilitate în cadrul tabelelor de date. pentru variabila „nume”. pentru a m ri l &imea coloanei de afi#are a numelui subiec&ilor. nu influen&eaz în niciun fel modul de prelucrare a datelor. fie introduce&i valoarea 16 pentru caracteristica Columns a variabilei „nume”. Caracteristica Align controleaz modul în care sunt aliniate valorile variabilelor în tabelul de date. În exemplul nostru de baz de date. deci nu vom configura aceast caracteristic . ci doar aspectul tabelului de date din Data View. Aceast caracteristic . Caracteristica Columns permite specificarea l &imii coloanei în care se vor afi#a valorile variabilelor în modul Data View. coloanele au o l &ime egal cu 8 caractere. Introducerea diferitelor valori pentru aceast caracteristic permite ajustarea #i redimensionarea precis a l &imii coloanelor. sunt dis- 50 . care este o variabil de tip string. Pute&i opta pentru o aliniere la stânga. Ultima caracteristic . Ca regul general . prin „tragerea” cu ajutorul maus-ului a liniei de separa&ie dintre dou coloane. Pentru a vedea întregul nume.

În sfâr#it. un set de reguli folosite în acest proces (Field. Variabila „sexul” nu este altceva decât tot o variabil nominal . Un aspect important pe care merit s -l men&ion m se refer la procesul de codare al variabilelor (proces pe care l-am întâlnit la codarea variabilelor sex #i nivel de #colarizare). 2005). 4 51 . care nu permite decât o clasificare a persoanelor în func&ie de genul lor biologic. sexul. În general. Stocarea numelui #i a prenumelui are o valoare pur informativ #i nu permite nici m car o clasificare a acestora. dac inten&ion m doar s clasific m subiec&ii în func&ie de studiile absolvite. Pentru a veni în sprijinul debutan&ilor. Ca observa&ie. Variabila „varsta” este variabila numeric prin care se stocheaz vârsta subiec&ilor. Vom lua în considerare a doua situa&ie #i o vom accepta ca variabil ordinal . Aceast variabil are intervale egale. reunindu-le sub denumirea de nivel scalar. zero absolut #i permite rapoarte în cadrul scalei. • Toate datele trebuie codate numeric.Cristian Opariuc-Dan ponibile doar nivelurile nominal #i ordinal de m surare. variabila „iq” este f r discu&ie o variabil de tip ordinal. în SPSS. respectiv „F” pentru feminin. am putea folosi #i „M” pentru masculin. Nivelul de m sur va fi deci nivelul nominal. nivelurile de m sur de interval #i de raport au fost reunite sub denumirea generic de nivel de m sur scalar. Iat c . Un asemenea proces de codare ar fi complet eronat. deci poate fi considerat la un nivel de m surare scalar4. dac ierarhiz m subiec&ii în func&ie de gradul lor de #colarizare. de exemplu. Proiectan&ii acestei aplica&ii au renun&at la distingerea celor dou . Newton #i Rudestam (1999) propun. sau se poate accepta un nivel ordinal de m surare la nivelul acesteia. Pentru a coda. în lucrarea „Your statistical consultant”. cercet torii cu experien& cunosc intuitiv modalitatea de codare optim a unei variabile. am reu#it în cele din urm s construim structura unei baze de date simple în acord cu principiile #i domeniile de defini&ie ale variabilelor #i cu nivelul lor de m surare. Variabila „scoala” poate fi privit ca o variabil nominal . parcurgând aceste etape.

una care s se refere la testarea ini&ial #i una vizând testarea final . Cu alte cuvinte. dac avem un experiment prin care. Aceste cifre nu au decât o valoare de etichet #i nu reprezint un proces de ierarhizare (nu spunem c masculinul este „mai jos” decât femininul deoarece are valoarea 1). La fel de bine putem s scriem 2 masculin #i 1 feminin sau 5 masculin #i 7 feminin. În anumite chestionare pot exista • 52 .Statistic aplicat în #tiin&ele socio-umane deoarece ar limita radical posibilit &ile de prelucrare statistic a datelor. Toate codurile pentru o variabil# trebuie s# fie mutual exclusive. va trebui s test m memoria subiec&ilor înainte de aplicarea tehnicii. În acest caz. iar fiecare coloan s se refere doar la o singur variabil . • Fiecare variabil# trebuie s# ocupe o coloan# distinct# în baza de date i fiecare subiect va ocupa o singur# înregistrare. în urma unei tehnici oarecare. iar datele vor fi consistente. Acest proces de codare poart numele de codare dummy. presupunem c îmbun t &im memoria. se vor aloca dou coloane pentru acea variabil . pentru a vedea dac au ap rut modific ri. nu trebuie s existe decât un singur num r ce poate fi stocat într-o variabil . de exemplu. Este foarte important ca datele unui subiect s ocupe un singur rând în baza de date SPSS. Astfel. atunci când suntem în astfel de situa&ii. De exemplu. Tot ceea ce trebuie s face&i este s re&ine&i codurile atribuite. Recomandarea este aceea c . 1 pentru Masculin #i 2 pentru Feminin. nu înc lc m aceast regul . În cazul în care o variabil este m surat de mai multe ori (tipic pentru experimente de tip testare ini&ial – testare final ). putem defini cele dou variabile prin mem_ini care reprezint testul ini&ial de memorie #i mem_fin care se refer la testul final. s aplic m tehnica #i apoi s test m din nou memoria subiec&ilor. este de preferat s folosim.

nu_PD. îns imposibil s trecem de la o variabil discret la una continu . se va proiecta o variabil . subiectul poate alege un singur partid. se prefer introducerea exact a valorii pentru vârsta subiectului. nu_PNG) cu categorii dihotomice de genul 0 – Neselectat. O asemenea situa&ie impune crearea unui num r de variabile egal cu variantele de r spuns (de exemplu nu_PSD. 1 – Selectat care vor fi analizate ulterior. De exemplu. asemenea itemi au #i o categorie de genul Altul. #i nu încadrarea subiectului în categorii de vârst (sub 14 ani. Sintetizarea valorilor #i cumularea categoriilor poate fi f cut mai târziu. în ani. „PD”. se pot folosi tehnici specifice de conversie. Du- 53 .Cristian Opariuc-Dan itemi care permit alegeri multiple (de exemplu. dac se va dori transformarea acestei variabile scalare într-o variabil discret . întotdeauna când este posibil. UDMR”. • Fiecare variabil# trebuie codat# astfel încât s# se ob&in# maximum de informa&ii. se vor folosi variabile continui la un nivel de m sur cât mai aproape de scala de raport. Este u#or s transform m o variabil continu într-una discret . „PNG” etc. Ca idee general . varsta. În acest caz. dou partide sau le poate alege pe toate). Ini&ial. În mod normal. la solicitarea: „Bifa&i din urm toarea list partidele cu care în mod sigur nu ve&i vota la urm toarele alegeri:” pot fi variantele de r spuns „PSD”. deoarece variabilitatea r spunsurilor confer o valoare statistic foarte redus .). peste 20 de ani etc. aceast categorie se analizeaz prin alte metode #i nu folosind SPSS. Categoriile sau valorile variabilei nu trebuie sintetizate în prima variant . între 14 #i 20 de ani. care va stoca vârsta exact a subiec&ilor. Care_______ prin intermediul c reia subiectul poate s -#i exprime liber op&iunea. nu_UDMR. De obicei. ci trebuie incluse exact a#a cum apar pe formularele de colectare a datelor. utilizând func&iile specifice SPSS. Ulterior. ordinal . numit grup_varsta.

Statistic aplicat în #tiin&ele socio-umane

p cum #ti&i deja, valoarea informativ cea mai ridicat o au totu#i variabilele continui, astfel încât profita&i de ele. • Fiecare subiect trebuie s# aib# o valoare pentru fiecare variabil#. Uneori nu este posibil s includem valori în fiecare coloan , fie deoarece subiectul nu a r spuns, fie pentru c itemul respectiv nu i se adreseaz . În acest caz, se recomand s l sa&i acea celul liber , deoarece SPSS este astfel proiectat încât s trateze celulele goale drept cazuri lips . Introducerea altor valori pentru cazurile lips poate crea confuzii. Respecta&i întotdeauna regula „ceea ce e cel mai simplu este #i cel mai bun”. Regulile de codare se vor aplica tuturor subiec&ilor. Acest lucru înseamn c nu pute&i aplica reguli valabile doar pentru anumi&i participan&i. De exemplu, dac dori&i ca anumite valori s fie tratate ca valori lips pentru un anumit subiect, nu pute&i face acest lucru. Valorile lips vor fi tratate similar pentru to&i subiec&ii. Folosi&i coduri în concordan&# cu sensul scalei. Unele chestionare presupun tipuri de scale ordinale (de exemplu 1 – niciodat , 2 – rareori, 3 – uneori, 4 – deseori, 5 – întotdeauna). De#i scalele pot fi codate #i invers (1 – întotdeauna, 2 – deseori, 3 – uneori, 4 – rareori, 5 – niciodat ), se recomand p strarea sensului natural al scalei pentru evitarea problemelor ulterioare referitoare la interpretare. Mai u#or asociem niciodat cu 1 decât niciodat cu 5. Oricum, chiar dac ulterior exist suficiente posibilit &i de recodare a valorilor astfel încât analiza s fie consistent , proiectarea adecvat a cercet rii #i cod rii v poate scuti de b t i de cap #i munc inutil .

54

Cristian Opariuc-Dan Dup proiectarea bazei de date, se recomand listarea structurii acesteia (a meta-informa&iilor) în vederea consult rii ulterioare. Dac nu ve&i lucra câteva luni cu baza de date, probabil c nu ve&i re&ine la ce se refer mem_ini sau mpg #i nici de ce tip este. SPSS prezint o modalitate u#oar de a afi#a structura bazei de date cu informa&ii complete. Nu trebuie decât s accesa&i meniul File #i apoi op&iunea Display Data File Information. Se va deschide o nou sec&iune care v invit s alege&i între a afi#a Figura 1.16 – Afi#area informa&iilor despre baza de date informa&iile bazei de date curente (Working File) sau cele ale unei alte baze de date de pe disc (External File…). Noi suntem interesa&i de afi#area structurii bazei noastre de date (IQ.sav) #i vom alege, a#adar, prima op&iune. În fereastra de rezultate (Output), vor ap rea o serie de tabele corespunz toare defini&iilor variabilelor din baza de date, astfel:
Tabelul 1.1 – Tabelul de structur a bazei de date

Variable Information Variable nume varsta sexul 3 iq 4 Position 1 2 Label Numele subiectului Varsta subiectilor Genul biologic al subiectilor Coeficientu l de inteligenta Measurement Level Nominal Scale Scale Column Width 14 8 8 Alignment Left Right Right Print Format A20 F2 F1 Write Format A20 F2 F1

Scale

8

Right

F3

F3

Variables in the working file

55

Statistică aplicată în ştiinţele socio-umane

III.2.5 Obţinerea indicatorilor tendinţei centrale în SPSS
Vă mai amintiţi, cred, de baza de date creată în SPSS în capitolul unu şi pe care am numit-o IQ. Haideţi să o deschidem. Dacă nu reuşiţi, revedeţi primul capitol. Acum vom introduce câteva date în SPSS. Trecem, deci, în modul „Data View” prin apăsarea tabulatorului din partea din stânga jos a programului SPSS. Se afişează o foaie de lucru, un tabel similar tabelului din Excel, în care, pe prima coloană, cea de culoare gri (capul de tabel), întâlnim numele variabilelor definite anterior. Modul de lucru este analog celui din Excel. Se scriu pur şi simplu datele în celule. Atenţie! Avem două variabile pentru care am asociat valori: variabila „sexul” şi variabila „scoala”. Aici nu vom scrie cuvântul „Masculin” sau „Feminin”, ci vom tasta 1 pentru „Masculin” şi 2 pentru „Feminin”. La fel şi în cazul variabilei „scoala”, vom tasta 1 pentru „Primare”, 2 pentru „Gimnaziu” şi aşa mai departe. Baza dumneavoastră de date trebuie să arate în final ca în figura de mai sus. O mică precizare. Pe bara de instrumente, penultimul buton se numeşte „Value Labels” şi arată ca în imaginea alăturată. La o apăsare a acestuia, butonul se activează, iar în baza de date se afişează etichetele asociaţiilor făcute, ca în figura alăturată. La o nouă apăsare, etichetele asociaţiilor nu se mai afişează, ci se afişează valorile asociaţiilor ca în figura mare de Figura 3.2 – Baza de date cu afişarea etichetelor asocierilor mai sus.

92

Vom analiza doar prima comandă. vom salva baza de date şi vom iniţia procedura de extragere a indicatorilor tendinţei centrale. care înseamnă variabilele pe care le introducem spre analiză.5 – Includerea variabilelor spre selectată are fundalul albastru (sau o analiză 93 . deoarece presupun şi alte informaţii. Urmează apoi lista „Variable(s)”. Primele trei codurilor de analiză descriptivă pe frecvenţe menzi din acest submeniu pot extrage indicatorii tendinţei centrale. Pentru a introduce o variabilă spre analiză. Comanda „Frequencies…” – sau frecvenţe – prezintă cele trei puncte. se află un buton de transfer (acel buton cu o săgeată pe el).Cristian Opariuc-Dan După ce am introdus cele 30 de date. Figura 3. printr-un clic simplu pe numele acesteia. trebuie să o selectăm. pentru a nu complica inutil expunerea. comanda „Frequencies…”.3 – Lansarea proceanalize – statistici descriptive. Cele mai simple comenzi. Alături de această listă.4 – Caseta de analize descripÎn partea stângă se află o listă cu tive utilizându-se frecvenţele toate variabilele din baza dumneavoastră de date. Figura 3. le găsim în meniul „Analyze” şi apoi în meniul „Descriptive Statistics”. Indicatorii tendinţei centrale ne sunt furnizaţi prin intermediul numeroaselor proceduri statistice. Daţi clic pe această comandă şi veţi obţine o casetă ca cea din imaginea de mai jos. O variabilă Figura 3. fapt care va duce la deschiderea unei noi casete de dialog. din lista de variabile din partea stângă. urmând ca celelalte două să le discutăm cu alte ocazii. În traducere.

înainte de a grupa valorile în clase. evident. am ales ca acest tabel al frecvenţelor să fie afişat. se află un număr de cinci butoane de acţionare. Caseta de bifare „Display frequency tables” informează aplicaţia SPSS dacă să afişeze tabelul frecvenţelor (în condiţiile în care această casetă o bifaţi) sau să nu-l afişeze (în condiţiile în care nu o bifaţi). o selectăm) şi o introducem în lista variabilelor totale din baza de date. Acum. Oricum. După ce o selectaţi. Observaţi că dacă am transferat variabila „Varsta subiectilor” în lista variabilelor supuse analizei. va trebui să obţineţi o imagine ca cea de alături. cu precizarea că unele dintre ele vor fi abordate în detaliu în cadrul altor capit ole. În figura din stânga.Statistică aplicată în ştiinţele socio-umane altă culoare în funcţie de schema de culori a calculatorului dumneavoastră). În partea dreaptă a acestui formular. acum. transferăm variabila „Varsta subiectilor” din lista variabilelor din baza de date în lista variabil elor supuse analizei. Iată că. Tabelul frecvenţelor este acel tabel general. deoarece va trebui să „spunem” programului ce variabile să analizeze şi pe care să nu le analizeze. În final.  Butonul „OK” este butonul pe care vom apăsa pentru a lansa analiza. acest buton de transfer ne va însoţi permanent în analizele noastre. butonul de transfer şi-a schimbat sensul. apăsaţi butonul de transfer (care va avea săgeata orientată spre lista „Variable(s)”) pentru a transfera variabila dumneavoastră în lista variabilelor ce urmează a fi analizate. după ce am configurat modul în care dorim ca analiza să fie efectuată. „scoatem” variabila noastră din lista variabilelor supuse analizei (după ce. Vom trece în revistă acum toate comenzile din această fereastră. studiat la capitolul despre organizarea datelor. dacă apăsăm pe el. 94 . în prealabil.

vom aborda şi aspecte legate de programarea în SPSS. putem stabili ce statistici descriptive vom analiza. Butonul „Cancel” este butonul prin care renunţăm la analiză şi închidem această fereastră. El se adresează utilizatorilor care doresc să facă programare în SPSS. Dacă ştiţi engleză. cu ajutorul acestui buton. toate variabilele din lista de analiză sunt eliminate. Butonul „Help” este butonul cu ajutorul căruia obţinem asistenţă şi informaţii (în limba engleză) referitoare la funcţionarea acestei proceduri. Butonul „Reset” permite reiniţializarea ferestrei la starea ei originală. Butonul „Statistics…” este butonul pe care vom şi apăsa acum pentru a calcula indicatorii tendinţei centrale. Este un buton pe care-l vom folosi destul de frecvent.    În partea de jos a formularului.Cristian Opariuc-Dan  Butonul „Paste” este un buton pe care nu-l vom folosi deloc. utilizând limbajul propriu de programare al acestei aplicaţii. După cum îi spune şi numele. toate configurările de analiză pe care le -am făcut sunt iniţializate la valoarea lor implicită. El permite „lipirea” codului care efectuează analiza curentă într-o fereastră de sintaxă de comenzi. Cu alte cuvinte. Într-o altă lucrare. Iată că cele Figura 3.6 – Fereastra de alegere a indicatorilor tendinţei centrale 95 . fără a mai efectua nicio operaţiune. nu ezitaţi să-l utilizaţi. SPSS are un tutorial excelent pe care îl puteţi parcurge şi înţelege cu succes. se află trei butoane care permit configurarea statisticilor pe care le vom calcula.

Acestea sunt elementele pe care dorim să le calculăm. în partea dreaptă a acestei noi ferestre. Variabila noastră este „vârsta subiecţilor” şi nu ne interesează să însumăm vârstele celor 30 de subiecţi. apăsăm butonul „Continue” (continuare). După ce am bifat cele trei casete. Ar fi un indicator fără nici o relevanţă pentru noi. găsim secţiunea „Central Tendency”. astfel încât formularul să arate ca în figura de mai sus. Acum am comunicat programului SPSS ce indicatori statistici să extragă. Pentru moment. respectiv configurarea modalităţii în care vor fi afişate rezultatele. Cam asta ar fi tot. prin bifarea căreia obţinem suma valorilor din variabila respectivă. Fereastra are mult mai multe opţiuni. observăm casetele de bifare „Mean” (media). am spus programului SPSS să calculeze media. „Median” (mediana) şi „Mode” (modul). Vom bifa deci. Butonul „Chart…” şi „Format…” permite afişarea unor grafice. În această secţiune. Mai există şi caseta de bifare „Sum” (suma).Statistică aplicată în ştiinţele socio-umane trei puncte de suspensie deschid acum o nouă fereastră. Despre aceste butoane vom discuta cu altă ocazie. adică exact ceea ce urmărim să punem în evidenţă. ne vom rezuma la cele care ne interesează.7 – Fereastra de afişare a rezultatelor 96 . Observăm că. prin efectuarea unui clic simplu pe ele. Practic. pentru a părăsi această fereastră şi a ne întoarce în cea iniţială. aceste casete. mediana şi modul pentru variabila „Varsta subiectilor” cu afişarea tabelului de frecvenţe. Nu ne rămâne acum decât să apăsăm butonul „OK” şi să Figura 3. una câte una.

Mult iple modes exist. toţi cei 30 de subiecţi au înregistrată vârsta lor. ne spune că media de vârstă este 29. „N”.00 mică. deoarece avem o distribuţie cu mai multe moduri (multimodală). The smallest v alue is shown value is shown”). Iată că a apărut fereastra de rezultate sau fereastra „Output”. 24 („Multiple Mode 24a modes exist. şi urmează să vedem care este şi cealaltă valoare modală. Apoi ne dă numărul de cazuri. Nu vom intra acum în detalii explicative ale acestei ferestre. În continuare. cel inferior. deci. Ne vom concentra asupra celor două tabele pe care le-a generat SPSS în partea din dreapta a ferestrei de rezultate (partea cea mare).7 – Indicatorii tendinţei centrale Statistics mează în josul tabelului că Varst a subiectilor sunt mai multe valori cu N Valid 30 frecvenţa cea mai mare şi Missing 0 Mean 29. un singur mod real. şi ne spune că sunt 30 de date valide („Valid”) şi zero date lipsă („Missing”). Acesta este.33 („Mean”). Tabelul se numeşte „Statistics” şi conţine în partea de sus numele variabilei.Cristian Opariuc-Dan vedem ce se întâmplă. iar modul…. Primul tabel conţine indicatorii tendinţei centrale pe care i-am configurat în etapa anterioară. Nu există nici un subiect la care să fi uitat să introducem această valoare. 97 . care nu reprezintă altceva decât cele două tabele pe care le-am solicitat. avem o problemă.33 că o va afişa pe cea mai Median 29. pentru a putea identifica variabila cu care operăm. mediana este 29 („Median”). Cu alte cuvinte. „Varsta subiectilor”. SPSS ne inforTabel 3. The smallest a. pentru că s-ar putea să vă speriaţi de prea multe informaţii şi să treceţi la „Solitaire”.

5 centimetri. Vom aborda aspectele grafice ale aplicaţiei SPSS 15. Asupra acestui aspect vom reveni şi vom avea ocazia să-l tratăm amănunţit într-un alt capitol. fiind mult mai simplă şi mai inteligentă. modalitatea de construcţie a graficelor diferă radical. Vom vedea cum putem reprezenta grafic datele folosind SPSS şi ce semnificaţie au aceste reprezentări.1 – Meniul pentru graficul cu bare Figura 4. vom deschide baza de date creată anterior.2 – Alegerea tipului de grafic cu bare În SPSS versiunea 15. „Clustered” (pe clusteri) şi 8 Figura 4. baza de date IQ. Adunăm 178 cu 165 şi împărţim la doi. IV. Avem la dispoziţie trei variante: „Simple” (simplu). În momentul în care am accesat opţiunea „Bar.Cristian Opariuc-Dan niciuna. în care va trebui să alegem tipul de grafic cu bare pe care dorim să-l reprezentăm. Aşadar. Obţinem 171. cu atât putem stabili mai precis media populaţiei. Iată că media eşantioanelor este un indicator care aproximează mai bine media unei populaţii. în meniul „Graphs” găsim toate posibilităţile de reprezentare grafică a datelor pe care SPSS le pune la dispoziţie8.” apare o nouă fereastră. la sfârşitul acestui volum şi în volumele viitoare 101 . Vom putea însă face media acestor două eşantioane. un indicator mai precis pentru media populaţiei. Această caracteristică a mediei eşantioanelor de a tinde către media populaţiei poartă în statistică numele de „teorema limitei centrale”. Cu cât avem mai multe eşantioane... şi ne propunem să reprezentăm datele noastre printr-un grafic cu bare. Vom folosi pentru aceasta meniul „Graphs” şi apoi opţiunea „Bar…” În general.1 Reprezentări grafice Am studiat în primul capitol o serie de reprezentări grafice uzuale.

Recunoaştem. un număr de trei opţiuni pe care le veţi folosi: prima opţiune. lista variabilelor din baza noastră de date. În cazul nostru. Aceasta este. „Summaries of separate variables” arată că două sau mai multe variabile vor fi parcurse. categoria corespunzătoare. iar barele vor reprezenta valorile sale. Există. Variabila pe care dorim să o reprezentăm este „Coeficient de inteligenţă”. după care apăsăm butonul „Define” pentru a defini variabilele ce vor fi reprezentate. Graficul pe clusteri îl folosim dacă dorim să includem o variabilă categorială (de exemplu. iar graficul aditiv prezintă valorile una deasupra alteia şi se foloseşte atunci când urmărim să vedem cu cât creşte o variabilă în timp sau care este rezultatul cumulării mai multor variabile. Apare o nouă fereastră cu mai multe elemente. pentru fiecare bară. vom folosi graficul cu bare simplu. „Summaries for group of cases” arată că SPSS va parcurge categoriile unei singure variabile şi va afişa. „iq”). Aşadar vom efectua clic pe imaginea graficului „Simple” pentru a-l selecta. În sfârşit.3 – Opţiunile de reprezentare ale graficului simplu cu bare 102 . iar barele vor indica fiecare dintre variabile. în partea stângă. primul element îl reprezintă caseta „Bars Represent” care se referă la ceea ce vor reprezenta barele noastre.Statistică aplicată în ştiinţele socio-umane „Stacked” (aditiv). şi opţiunea care ne interesează pe noi. de fapt. opţiunea „Values of individual cases” ne spune că SPSS va lucra cu o singură variabilă. dacă dorim să prezentăm comparativ coeficientul de inteligenţă al bărbaţilor şi al femeilor). Graficul simplu ne permite reprezentarea cu bare doar a variabilei noastre (în cazul nostru vom folosi reprezentarea cu bare a coeficientului de inteligenţă. A doua opţiune. această opţiune. după cum puteţi observa. Alegem. O vom selecta şi apoi vom apăsa butonul de Figura 4. deci. În partea dreaptă.

5 – Graficul cu bare simplu al genera graficul în fereastra de rezultate 125 Value Coeficient de inteligenta 120 115 110 105 100 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Case Number coeficientului de inteligenţă 103 . Gruparea poate fi efectuată fie pe linii. da un titlu graficului nostru apăsând butonul „Titles…”. care devine activ. Utilizarea acestui buton v-o lăsăm dumneavoastră ca exerciţiu. îl putem folosi pentru a desena graficul nostru. Putem. cazuri în Figura 4. Secţiunea „Category Labels” ne permite să alegem dacă pe axa categoriilor (axa OX) va fi afişat numărul fiecărui caz (opţiunea „Case number”) sau valorile unei alte variabile categoriale pe care le vom specifica (opţiunea „Variable:”).Cristian Opariuc-Dan transfer pentru a o include în caseta „Bars Represent” ca în figura de mai jos. atât avem de făcut în vederea trasării graficului cu bare. Pentru moment. fie pe coloane. Dacă avem vreun şablon de grafic preferat.4 – Reprezentarea prin grafic cu bare care va trebui să specificăm şi varia QI pe nivele se şcolarizare şi în funcţie de sex abilele categoriale în funcţie de care se va face gruparea. bifând caseta „Use chart specification from:” şi apoi apăsând butonul „File…” care se activează şi ne invită să încărcăm acel fişier. Există şi alte opţiuni pe care le putem folosi. descărcat de pe Internet sau construit de noi. introducându-le în listele „Rows:” sau „Columns:”. de asemenea. SPSS va Figura 4. apăsăm butonul „OK”. După ce am terminat de stabilit variabila pentru care dorim să trasăm graficul. Secţiunea „Panel by” permite gruparea barelor în funcţie de o altă variabilă categorială.

vom accesa. al frecvenţelor relative şi al frecvenţelor cumulate absolute sau relative. Folosind SPSS. despre poligonul frecvenţelor absolute (al valorilor individuale).Statistică aplicată în ştiinţele socio-umane (Output). veţi putea face combinaţii între variabile pentru a realiza grafice intuitive cu care să vă susţineţi demonstraţiile statistice. tot meniul „Graphs” şi apoi. reprezentarea cu bare care ne interesează. un grafic cu bare. După ce veţi stăpâni la un nivel suficient de ridicat lucrul în SPSS. folosind un grafic cu bare. submeniul „Line…”. în care am folosit ca variabilă etichetă „Nivelul de şcolarizare”. iar graficul este împărţit pe linii după variabila „Sexul subiecţilor”. vă prezentăm. în cel de jos fiind reprezentat coeficientul de inteligenţă al bărbaţilor. este indicat şi nivelul de şcolarizare al subiectului respectiv. aşadar. Iată.Reprezentarea prin grafic cu bare a QI pe nivele se şcolarizare şi în funcţie de sex Observăm două grafice. iar în graficul de sus cel al femeilor. de asemenea. pentru fiecare bară. rezultând un desen ca în figura de mai sus. La fel ca în 104 . vom putea desena poligonul valorilor individuale prin folosirea unui grafic cu linii. Pentru a exemplifica şi celelalte facilităţi ale acestei reprezentări grafice. Lansând procedura de desenare prin apăsarea butonului „OK”. Pentru aceasta.6 . obţinem următorul grafic cu bare: 125 120 Feminin 115 Value Coeficient de inteligenta 110 105 100 125 120 Sexul subiectilor Masculin 115 110 105 100 Li Li Li Gi Li Li Po Po Fa Fa Fa Fa Fa Pr Pr Gi Li Li Li Li Po Po ce ce ce m ce ce stl stl cu cu cu cu cu im im m ce ce ce ce stl stl u u u na u u ic ic lta lta lta lta lta ar ar na u u u u ic ic zi ea ea te te te te te e e zi ea ea u la la u la la Po stl ic ea la Po Li Li Li Po Fa Fa stl ce ce ce stl cu cu ic u u u ic lta lta ea ea te te la la Nivelul de scolarizare Figura 4. Dacă privim cu atenţie pe axa OX. În primul capitol discutam. observăm că. valorile variabilei „Varsta subiectilor”. Exerciţiu: Reprezentaţi. în figura alăturată.

Cristian Opariuc-Dan graficul cu bare. deoarece dorim Figura 4. Pentru a putea lansa procedeul de definire a graficului. cu ajutorul căruia putem reprezenta două sau mai multe categorii de date. Nu vom intra din nou în detalii Figura 4. putem apăsa butonul „Define”. În fereastra 105 . Avem de ales între un grafic simplu („Simple”). şi aici avem cele trei opţiuni cu exact aceeaşi semnificaţie.7 – Meniul să reprezentăm un poligon al pentru graficul cu linii frecvenţelor individuale. pentru a indica programului SPSS variabila pe care urmează să o reprezinte prin linii. La fel ca în cazul graficului cu bare. opţiunea „Values of individual cases”. deoarece ele au fost discutate la graficul cu bare. Vom transfera doar variabila „Coeficient de inteligenţă”. Pentru exemplul nostru. se afişează o nouă fereastră care ne invită să alegem tipul graficului pe care-l dorim.rea tipului de grafic cu linii telor pe care le găsim aici. Vom alege. aceasta este singura diferenţă linii între cele două ferestre. De Figura 4. care ne interesează şi pe noi.8 – Selectaasupra elemen.9 – Definirea graficului simplu cu fapt. ce permite trasarea a două sau mai multe variabile pe acelaşi grafic şi un grafic de tip pivot („Drop-line”). Observăm apariţia unei ferestre identice cu fereastra pe care am întâlnit-o la graficul cu bare şi care are exact aceeaşi funcţionalitate. din lista variabilelor în lista „Line Represents”. ca şi în exemplul anterior. vom alege graficul de tip simplu. un grafic cu linii multiple („Multiple”).

acest element se numea „Bar Represent”.10 – Poligonul frecvenţelor absolute pentru coeficientul de inteligenţă Cum am putea totuşi să reprezentăm grafic poligonul frecvenţelor absolute cumulate? Ne amintim. din capitolul despre organizarea datelor. pentru a lansa procedura de desenare a graficului. în fereastra de rezultate. avem la dispoziţie mai Figura 4. am văzut că la desenarea unui grafic cu linii (sau cu bare) în SPSS. De data aceasta. deoarece ne interesează să Figura 4. Nu ne rămâne acum decât să apăsăm butonul „OK” care vedem că s-a activat. Iată. că frecvenţele cumulate se calculează prin adăugarea frecvenţei unei valori la frecvenţa cumulată a valorii anterioare. Rămânem tot la graficul simplu. vom merge tot în meniul „Graphs”. Value Coeficient de inteligenta 125 120 115 110 105 100 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Case Number Figura 4.11 – Configurarea graficului pentru multe opţiuni. adică îi vom comunica programului să cumuleze întrun fel valorile unei variabile. ”.12 – Stabilirea parametrilor de configurare a frecvenţelor cumulate 106 . iar frecvenţele cumulate noi nu am folosit decât opţiunea „Values of individual cases”. ci „Summaries for groups of cases”. Nu vom mai alege acum „Values of individual cases”. La fel. şirul valorilor fiind un şir ordonat. opţiunea „Line..Statistică aplicată în ştiinţele socio-umane anterioară. apare după câteva momente şi poligonul frecvenţelor individuale pe care l-am solicitat. deoarece suntem în faţa unui grafic cu linii. iar aici se numeşte „Line Represents”. deoarece era vorba de un grafic cu bare.

în care nu mai introducem pur şi simplu variabila. În cazul nostru. N”. de asemenea. Avem de stabilit şi variabicumulate la pentru care vom desena poligonul frecvenţelor cumulate absolute. „Cum. În momentul în care am schimbat opţiunea cu care vom defini datele în zona grafică. pe care trebuie să o introducem în câmpul „Category Axis:”. Putem opta pentru „N of cases”. am ales opţiunea „Cum. folosind opţiunea „Other statistics”. Cea mai importantă secţiune este „Line Represents”.Cristian Opariuc-Dan reprezentăm o singură linie şi nu un grup de linii sau categorii de linii. ca în figura alăturată. Nu intrăm acum în detalii legate de această opţiune. deoarece dorim să reprezentăm frecvenţele cumulate Figura 4. ci definim modul în care vor fi cumulate datele. Există multe elemente comune cu fereastra anterioară. folosind butonul de transfer din faţa acestui câmp. Acum. obţinând un poligon al frecvenţelor absolute pe date grupate.13 – Poligonul frecvenţelor absolute. evident. să precizăm ce indicatori se vor folosi prin activarea butonului „Change Statistic…”. Lansăm apoi procedura de definire a graficului. 30 25 Cumulative Frequency 20 15 10 5 0 100 101 103 104 105 107 108 109 110 111 120 121 124 Coeficient de inteligenta 107 . %”. adică apariţiile fiecărei valori în şirul de date (frecvenţele). prin apăsarea butonului „Define”. prin care SPSS va număra apariţiile fiecărei valori în şirul de date. situaţie în care va trebui să includem variabila pentru care vom extrage anumiţi indicatori statistici şi. va apărea o altă fereastră de definiţie a datelor. N”. însă şi secţiuni specifice pe care vom încerca să le descriem pe scurt. dar prezentate cumulat şi exprimarea procentuală a acestora (sau frecvenţele relative şi relative cumulate) – „% of cases” şi „Cum. Există şi posibilitatea să reprezentăm grafic anumite statistici.

cum ar fi „genul biologic” sau „nivelul de şcolarizare”. şi. „Summaries for groups of cases”. în plus. iar următoarea Figura 4. Folosind celelalte trei opţiuni. vom apela tot la meniul „Graphs” şi vom alege apoi Figura 4.Statistică aplicată în ştiinţele socio-umane nu mai trebuie decât să apăsăm butonul „OK” şi obţinem. folosind un grafic de tip „plăcintă” (pie). iată. activităţi pe care vi le lăsăm ca exerciţiu.15 – Alegerea tipului de grafic fereastră prezintă doar cele trei opţiuni pe care le-am discutat. cu liceu etc. Vom selecta acum prima opţiune. Figura 4. SPSS va aduna cazurile care au o aceeaşi valoare. Deci.”. Reprezentarea procentuală a unor variabile categoriale. se poate face. această reprezentare să aibă un caracter procentual. cei cu gimnaziu. nu mai avem ce tip de grafic plăcintă să selectăm.. cel mai bine. pot fi desenate poligoanele frecvenţelor absolute şi ale frecvenţelor relative şi relative cumulate.16 – Configurarea reprezentării prin diagramă de structură 108 . poligonul frecvenţelor absolute cumulate aşa cum ne-am dorit. Pentru a reuşi acest lucru. alegând această opţiune.14 – Meniul pentru diagramele de structură submeniul „Pie. Cu ajutorul programului SPSS. vom încerca să desenăm graficul de tip plăcintă pentru variabila „nivel de şcolarizare”. numit şi diagramă de structură. deoarece ne interesează să reprezentăm grafic frecvenţele cu care apar subiecţii cu studii primare.. De această dată.

Cristian Opariuc-Dan Pentru a defini graficul. Evident. aşadar. apoi. Singura deosebire constă în secţiunea „Slices Represents” sau. Acest lucru îl putem face prin transferarea variabilei „Nivelul de şcolarizare” din lista variabilelor din baza de date în caseta „Define Slices by:” Selectaţi. câteva metode extrem de simple prin care putem desena grafice intuitive utilizând aplicaţia SPSS. Cei mai puţini sunt cei cu studii primare şi gimnaziale. în această secţiune am selectat opţiunea „% of cases”. procedăm ca şi în exemplul anterior. În acest moment. aşadar. se activează şi butonul „OK” pe care va trebui să apăsăm pentru a lansa în execuţie procedura de desenare a graficului. Figura 4. Desigur. ce reprezintă feliile plăcintei. Se va deschide fereastra de definire a graficului. în proporţii relativ egale. Toate aceste statistici pe care le-am 109 . Putem cu uşurinţă constata că majoritatea subiecţilor sunt absolvenţi de liceu. După câteva momente. o fereastră pe care o cunoaştem deja de la reprezentarea poligonului frecvenţelor cumulate. tradus. trebuie să precizăm şi variabila pentru care vor fi reprezentate grafic procentele. absolvenţi de postliceală şi facultate. apăsând butonul „Define”. variabila în lista variabilelor din baza de date şi apăsaţi butonul de transfer din faţa acestui element pentru a obţine o imagine ca în figura alăturată. adică am comunicat programului SPSS să-mi reprezinte grafic procentul în care se găseşte fiecare nivel al acestei variabile în eşantionul total.17 – Diagrama de structură pentru obţinem în fereastra de rezultate urmănivelul de studii torul grafic plăcintă: Primare Liceu Gimnaziu Postliceala Facultate Nivelul de scolarizare Observăm că acest grafic prezintă şi o legendă prin care suntem informaţi asupra categoriilor variabilei analizate. Iată.

fereastra studiată în capitolul anterior. se află un alt buton. la fel ca în capitolul anterior. Se deschide o nouă fereastră. variabila „Coeficient de inteligenţă”. desigur. butonul „Charts…” pe care vom apăsa. deoarece scopul acesteia este acela de a explora. Această opţiune o grafică din analiza frecvenţelor întâlnim aici. Dacă nu. Sper că vă amintiţi cum se face. iată. vă dau un ind iciu: folosiţi butonul „Statistics…”. alături de caseta de bifare „With normal curve” ce permite desenarea curbei normale care caracterizează datele din variabila noastră. pentru a extrage indicatorii tendinţei centrale. de a cunoaşte structura datelor analizate. Nu vom 110 . Opţiunea „None” nu desenează niciun fel de grafic şi ignoră setările grafice. v-o reamintesc. Iat-o. în care putem stabili ce grafic să desenăm pentru variabila introdusă în analiză. Iată că. deoarece reprezentarea grafică a datelor se Figura 4. Opţiunea „Bar charts” desenează un grafic cu bare.18 – Selectarea variabilei ce urpoate face şi în acest mod.Statistică aplicată în ştiinţele socio-umane prezentat şi pe care le vom mai prezenta fac parte din analiza de date exploratorie. opţiunea „Pie charts” desenează grafice plăcintă şi.19 – Modul de reprezentare rea unei histograme. opţiunea „Histograms:” ne permite desenaFigura 4. prin care am calculat indicatorii tendinţei centrale. lângă acest buton. Să inmează să fie reprezentată troducem. Vă mai amintiţi. iar dumneavoastră va trebui să găsiţi comenzile prin care să ajungeţi la ea.

prin selectarea uneia dintre cele două opţiuni din secţiunea „Chart Values”.20 – Histograma pentru coeficientul lansa analiza. cel mai precis indicator. Utilizând reprezentă111 .511 N =30 100 105 110 115 120 125 de inteligenţă După câteva momente. Folosind această fereastră. Dev. Apăsăm butonul „Continue” pentru a confirma acţiunea noastră şi Coeficient de inteligenta apoi butonul „OK” pentru a Figura 4. în acest caz.2 Analiza grafică a tendinţei centrale Afirmam în capitolul dedicat indicatorilor tendinţei centrale că media este cel mai „fin”. alături de o serie de date din inventarul statistic de bază. deoarece despre curba normală vom discuta într-un alt capitol. avem de Histogram configurat mult mai puţine elemente. cum ne dăm seama de existenţa acestor scoruri extreme? Tot analiza exploratorie ne vine în ajutor. pe care le vom discuta într-un alt capitol. Ne rezumăm să alegem doar graficul sub formă de histogramă. însă ne va oferi şi histograma variabilei „Co eficient de inteligenţă”. 5 4 Frequency 3 2 1 0 Mean =111. Deoarece am introdus anterior variabila pe care dorim să o analizăm.Cristian Opariuc-Dan bifa acum această casetă. SPSS va lua singur decizia modului în care va desena graficul. IV.33 Std. însă ea are o problemă – este sensibilă la scoruri extreme şi. Anumite grafice pot fi reprezentate sub formă de frecvenţe absolute (opţiunea „Frequencies”) sau sub formă de frecvenţe relative (opţiunea „Percentages”). =8. Totuşi. nu mai aproximează bine tendinţa centrală a setului de date. SPSS va extrage indicatorii tendinţei centrale sub forma celor două tabele discutate în capitolul anterior.

tulpina 0 cuprinde scorurile de la 0 la 9. acest grafic aduce în plus posibilitatea monitorizării scorurilor individuale. la tulpina 0 (scoruri între 0 şi 9) avem o singură apariţie a lui 2. 20. tulpina 1 scorurile de la 10 la 19. iar „frunzele” valorile „unităţilor”.2. Deci. Astfel. tulpina 2 . 20. Dacă avem. La tulpina 2 (scoruri între 20 şi 29) avem frunza 0 cu trei apariţii (trei scoruri de 20) şi frunza 5 cu o singură apariţie (un singur scor de 25). Există oare o metodă mai precisă de a le depista? Răspunsul este pozitiv şi vom prezenta în continuare două tipuri de grafice deosebite. dar care pot caracteriza mai precis scorurile extreme. de exemplu. 19.1 Graficul „tulpină şi frunze” A fost conceput de către Tuckey (1977) şi se aseamănă foarte mult cu histogramele de frecvenţe. „Tulpina” reprezintă valorile „zecilor”. 112 . Un asemenea grafic se desenează mai uşor manual decât computerizat şi oferă o imagine precisă a distribuţiei. 19. nu? Iată că. Frunzele reprezintă frecvenţele scorului observat. 2002). însă. ne putem face o imagine intuitivă asupra acestor scoruri extreme. spre deosebire de acestea.scorurile de la 20 la 29 şi aşa mai departe. 25 şi dorim să construim un grafic „tulpină şi frunze”. următorul şir ordonat de date: 2. La tulpina 1 (scoruri între 10 şi 19) avem frunza 2 de două ori (adică două apariţii ale lui 12) şi frunza 9 de două ori (două apariţii ale lui 19). IV. deşi seamănă cu o histogramă. 12. 12. afişează şi scorurile individuale.Statistică aplicată în ştiinţele socio-umane rile de date de mai sus. acesta va arăta după cum urmează: Tulpina 0 1 2 Frunzele 2 2299 0005 Oare ce informaţii noi ne aduce acest grafic şi cum se interpretează? Destul de simplu. Simplu. și alții. deoarece alături de reprezentarea numerică oferă şi o imagine vizuală a datelor analizate (Dancey. 20.

24. 44. Pentru acest set de date. iar datele sunt relativ grupate. 9. apoi între 5 113 . 5. 0. 34. 7. 18.2 . scorul 64. 42. 3. 2. 3. 25. 7. 15. 5. am putea decide utilizarea mediei ca indicator al tendinţei centrale. 5. 9. 2. 12. 18. 13. 13. 7. 0. Putem observa că scorurile de la tulpina 2 (între 20 şi 29) sunt cele mai frecvente. 3. avem următorul grafic „tulpină şi frunze”: 0 1 2 3 4 11222555 2222444455588 44444455555558888888 22333344444455555 222334 Prin această reprezentare avem o metodă mai concisă şi mai sintetică de explorare a unui volum mare de date. 1. 42. 34. 14. 25. 10. 0. 25. Comparativ. 7. 10. 35. 5. 35. 13. 5. 7. 35. ci blocuri de cinci (între 0 şi 4. 34. 7. să considerăm un şir de date cu scoruri extreme şi să îl reprezentăm sub forma acestui grafic. 9. Prin urmare ar fi mai comod pentru noi să reprezentăm grafic aceste scoruri folosind nu blocuri de 10. 5. 12. 7. 10. 5. 12. 43. 25. 25. deoarece există foarte multe. 34. în care mediana va fi cel mai bun indicator al tendinţei centrale. 7. 64 Graficul pentru acest şir de date ar fi: 0 1 2 6 0000022222222333333333555555555555555777777777777799999999 000000033333888 3 4 Observăm că graficul ne indică faptul că majoritatea scorurilor se situează sub 20. însă avem şi un scor extrem. Iată deci o situaţie tipică. 28. 28. 25. 3. 18. 15. 5 . 5. 2. 5. 35. 10. fără scoruri extreme.2 . 33. 5. 18. 35. 3. 43. 0. 5. 2. 14. 28. 3. 24. 9. 32. 5. 28. 5. 9. Nu avem o reprezentare foarte clară a scorurilor sub 20. 5. 28. 24. 33. 14. 34. 7. 28. 33. 7. 14. 13. 3. 7. 24. 9. 9. 2. 12. 2. 15. 10. 2 . 0. 42. 18. 9. 2. 5. 3. Totuşi. 5. 25. 28. 13. 33. 24. 23. 5. 32. 24. acest grafic efectuat pe blocuri de 10 valori nu este foarte informativ. 5. să considerăm un set mai voluminos de date: 1. 2. 10. 7. În acest caz. 3. 7. 10.Cristian Opariuc-Dan Pentru a înţelege mai bine.

însă. Rolul acestei reprezentări este mai ales acela de a identifica existenţa scorurilor extreme într-un set de date în vederea stabilirii indicatorului tendinţei centrale ce va fi folosit. comparativ. accentul căzând mai mult pe valori individuale şi se pierde tendinţa de ansamblu. în situaţia în care dorim. se pot reprezenta. a se pierde repartiţia scorurilor individuale în distribuţie. Am văzut atunci că un număr mare de clase reprezintă o abordare analitică. Unul dintre avantajele incontestabile ale acestui grafic este acela că permite o viziune de ansamblu fără. Folosind un asemenea sistem. La fel. pe la începutul lucrării noastre. unde vedem clar tendinţa de ansamblu. ceea ce reprezintă un plus de informaţie. 0* 1. Discutam. lucrurile au devenit ceva mai clare. 0000022222222333333333 555555555555555777777777777799999999 000000033333 888 3 4 Observăm că am folosit punctul (. Există acelaşi scor extrem. însă de pierde viziunea individuală. între 10 şi 14 şi aşa mai departe). graficul devine: 0. însă acum putem afirma precis că cei mai mulţi subiecţi au obţinut rezultate între 5 şi 9. Utilizând cele două seturi de date de mai sus. 64. am abordat şi problema organizării datelor în clase. 6.Statistică aplicată în ştiinţele socio-umane şi 9. despre situaţia în care ordonăm toate valorile posibile şi apoi stabilim frecvenţele absolute prin numărarea apariţiilor fiecărui scor individual. am putea să le reprezentăm grafic după cum urmează: 114 . 1* 2. De data aceasta. două distribuţii. un număr mic de clase determină o perspectivă sintetică. Prin intermediul acestui tip de grafic. spre exemplu.) pentru a desemna prima jumătate a blocului (0-4) şi steluţa (*) pentru a desemna a doua jumătate a blocului (59). Analog. să comparăm rezultatele la două probe psihologice.

cuprinzând între aceste limite. Distanţa dintre cele două baze (intervalul cuartil) poartă numele de hspread sau pe scurt H. vom parcurge următorii paşi. Orice scor mai mare de limita „mustăţii” superioare sau mai mic de limita „mustăţii” inferioare se consideră a fi un scor extrem. 20. Între limitele acestor două mustăţi se află zona normală. și alții. De la cele două baze pornesc. La fel ca graficul „tulpină şi frunze”. 115 . corespunzătoare percentilei 50. O metodă mai precisă o reprezintă graficul „cutie” sau graficul „cutiei cu mustăţi”. considerând şirul ordonat de date 2. 12. 19. două „mustăţi” de lungime maximă 1. 20. Această tehnică. acest tip de grafic se utilizează tot mai frecvent în ştiinţele socio-umane. 19. o metodă precisă de depistare a scorurilor extreme (Dancey. Pentru realizarea acestui grafic.2. graficul „cutie” descrie modul în care sunt distribuite datele şi oferă. IV. în plus.Cristian Opariuc-Dan Test 1 9999999977777777777775555555555555553333333332222222200000 888333330000000 3 Test 2 11222555 2222444455588 44444455555558888888 22333344444455555 222334 4 0 1 2 3 4 5 6 Datorită uşurinţei în realizare şi a avantajelor pe care le oferă. În interiorul acestui dreptunghi se află marcată linia mediană. uneori devine destul de puţin sensibil. la fel ca tehnica anterioară. 20. a fost descoperită de către Turkey (1977) şi reprezintă una dintre cele mai importante metode de analiză exploratorie a datelor. în sus şi în jos. iar baza superioară în dreptul percentilei 75. 2002).2 Graficul „cutie” (box-plot) Deşi graficul anterior sesizează scorurile extreme suficient de bine. iar scorurile extreme sunt greu de observat. 50% dintre rezultate (în fapt. intervalul cuartil despre care vom vorbi în capitolul următor). Acest tip de reprezentare este formată dintr-un dreptunghi cu baza inferioară situată în dreptul percentilei 25. 25. 12.5 H.

12. 19. 1. 19. al treilea cuartil va fi situat între poziţia 7 şi poziţia 8 şi va avea valoarea 20. 20. 12. numit şi cuartilul superior). Putem acum trasa dreptunghiul care ne interesează (box). Reconsiderând exemplul.5 x 8 = 12. 20. 20. Dacă mediana este valoarea care împarte şirul ordonat de date în două părţi egale. Acest factor nu reprezintă decât amplitudinea scorurilor dintre cei doi pivoţi (intervalul cuartil). 2. În cazul nostru. 12. mediana este 19. 19. după cum vom vedea în capitolul ce urmează. Pasul 4 – Stabilirea scorurilor extreme. Aceste puncte de referinţă se numesc limite de barieră. Deci limitele 116 . cuartilul este valoarea ce împarte acelaşi şir în 4 părţi egale. obţinem poziţia primului cuartil între a doua şi a treia valoare. adică primul cuartil va avea valoarea 12 (amintiţi-vă exemplul de calcul al medianei). 19.Statistică aplicată în ştiinţele socio-umane Pasul 1 – Stabilirea medianei şi a poziţiei pe care aceasta o ocupă în cadrul şirului de date. 25 Pivoţii. vor avea valorile 12 şi 20. În cazul nostru. h-spread = 20 – 12 = 8. În cazul nostru. iar poziţia pe care o ocupă este poziţia a cincea. Un scor extrem este un scor care depăşeşte o dată şi jumătate valoarea factorului h-spread raportat la cei doi pivoţi. în cazul exemplului de faţă. 20. 25 Pasul 2 – Calculul „pivoţilor”. 20. Similar. 2. Pivoţii reprezintă valorile care împart şirul de date în sfertul inferior (primele 25% dintre scoruri. numit şi cuartilul inferior) şi sfertul superior (ultimele 25% dintre scoruri. 12. 20. Pivot superior – valoarea 20 Linia medianei – valoarea 19 Pivot inferior – valoarea 12 Figura 4.21 – Calculul pivoţilor Pasul 3 – Obţinerea valorii expansiunii (factorul h-spread).

20. 0. 2. Figura 4. Zona „mustăţilor” reprezintă de fapt amplitudinea scorurilor care părăsesc zona aşa. Scorurile mai mici de 0 vor fi considerate extreme.Cristian Opariuc-Dan de barieră sunt 12 – 12 = 0 şi 20 + 12 = 32. care conţine mediana. 0. deoarece 2 se află între 0 şi 12. iar dreptunghiul format de cei doi pivoţi. se numeşte „cutie”. 12. scoruri care însă rămân în limitele barierelor. 0. Orice scor care iese din limita barierelor se numeşte scor extrem. iar 25 este situat între 20 şi 32. scorurile adiacente sunt 2 şi 25. 19. 0. 20. De aici provine şi numele graficului. 0. Pasul 5 – Scorurile care se află între pivoţi şi limitele de barieră.numită normală. iar scorurile mai mari de 32 vor fi considerate de asemenea extreme. 2. 20. 19.22 – Graficul box-plot 117 . mai apropiate de limitele de barieră se numesc scoruri adiacente. deoarece depăşesc limita de barieră inferioară în jos. delimitată de cei doi pivoţi. grafic „cutie” sau „cutie cu mustăţi”. 12. În cazul nostru. deoarece depăşesc în sus limita de barieră superioară. 25 Liniile cuprinse între pivoţi şi bariere (zonele scorurilor adiacente) poartă numele de „mustăţi”. Dacă reconsiderăm şirul anterior de date.

7.00 20. mai ales în condiţiile în care acestea ar afecta puternic analiza datelor. 13. 9. 7. 5.00 0. 2.00 60. 118 . 3. 5. 13. indicatorul care exprimă cel mai bine tendinţa centrală este mediana. 5. 9. Deci poziţia 77 se referă la Figura 4. 9. ci poziţia acestora în şirul ordonat de date. 3. totuşi. 5. două scoruri extreme în şirul nostru de date şi anume scorul 23 şi 64. în acest caz. 5. 5.00 50. 2. 23. Se observă scorul extrem. Desigur. 10. adică la valoarea 64. Programul SPSS oferă şi o m odalitate de a marca scorurile extreme.00 Iată că observăm existenţa a două scoruri extreme însă…. 3. 7. 7. 70.Statistică aplicată în ştiinţele socio-umane 2. 10. 7. 18. 10. alături de poziţia 76 (corespunzătoare scorului 23) apare un cerculeţ. 10. 5.00 40. Observăm că alături de poziţia 77 (corespunzătoare scorului 64) apare o steluţă. 5. 9. 7. 64. 2. 5. 2. 3. 18. 7. 13. în sensul că valoarea 64 este foarte îndepărtată de limita superioară a şirului de date. Totuşi. 77 şi 76 nu reprezintă scorurile propriu. 9. De asemenea. 5. 9. 13. 2. 5. Avem. atunci graficul nostru se va prezenta ca în figura de mai jos. Această steluţă are rol de avertisment. 3. 9. 3. acestea sunt notate cu 77 şi 76. 10. Am fi înclinaţi să credem că aceste valori reprezintă scorurile înseşi. 10. al 77-lea element ultimul scor. 3. 5. iar poziţia 76 la penultimul scor.00 30. 7. 2.00 10. 5.zise. nu este. 18. 7. 3. Prin urmare. 10. 5.3 Tratarea scorurilor extreme Nu ne putem mulţumi să constatăm doar existenţa acestor scoruri extreme.23 – Graficul box-plot în SPSS. 5. Acest cerculeţ ne spune că. 5. 9. 13. să nu uităm că acest grafic se bazează pe poziţia unui scor în şirul ordonat de date. 7. deşi 23 este şi el un scor extrem. adică la valoarea 23. 3. 7. aşadar. atât de depărtat de limita superioară a şirului de date. 77 76 Exemplu IV. 7. 7.

Nu trebuie decât să analizăm minimul şi maximul distribuţiei. evident. la care subiecţii răspund la întrebări pe o scală de la 1 la 5 şi. Dacă introducem un chestionar. va apărea. 2003)  Cea mai frecventă sursă se referă la erorile de înregistrare a datelor. Din fericire. Putem. tastăm. Probabilitatea ca un elev să fie baschetbalist este destul de mare. 55. iar pentru aceasta extragem zece persoane din două clase. Dacă avem „ghinionul” să îl selectăm tocmai pe acela. de unde pot să apară aceste scoruri extreme? Ce surse pot determina prezenţa unor asemenea valori? (Popa. printre care am găsit şi un elev cu înălţime normală. iar posibilitatea de apariţie a unui caz atipic (extrem) va deveni foarte mare. în loc să tastăm 5. Erorile de eşantion se referă la situaţia în care eşantionul estras este prea mic. determină imposibilitatea utilizării statisticilor parametrice. de exemplu. Totuşi.  119 . putem sorta datele crescător sau descrescător şi putem corecta mai uşor erorile sau putem apela la o operaţiune de recodificare. evident că acesta va apărea ca fiind un scor extrem. dacă una dintre clase este reprezentată de clasa de sport.Cristian Opariuc-Dan Un scor extrem duce la o distribuţie de date care nu mai respectă criteriul normalităţii. din greşeală. Dacă una dintre aceste valori iese din domeniul de definiţie. să studiem înălţimea unor subiecţi dintr-un liceu. face media un indicator irelevant pentru acel set de date şi. remedierea acestei probleme este simplă. De asemenea. Dacă sunt mai multe valori incorecte. dar şi la cazul în care eşantionul a fost extras dintr-o populaţie asimetrică. putem reveni uşor la baza de date şi o vom corecta. implicit. acea înălţime normală se va comporta ca un caz extrem. cu elevi înalţi. şi un caz extrem.

Statistică aplicată în ştiinţele socio-umane  Erorile determinate de existenţa unor populaţii diferite de valori apar atunci când în eşantionul studiat găsim. o serie de metode prin intermediul cărora putem verifica rapid şi precis structura datelor cu care lucrăm. La înregistrarea temperaturii unor persoane. De exemplu. mai multe grupe de subiecţi care diferă între ele. înaintea realizării prelucrărilor statistice prin metode şi tehnici specifice. avem suficiente şanse ca salariile conducerii să se comporte ca scoruri extreme în raport cu celelalte categorii de angajaţi. dacă studiem veniturile angajaţilor unei întreprinderi. la un moment dat. Deoarece tehnicile de transformare a datelor brute presupun şi alte cunoştinţe. 120 . aparatul de înregistrare sau. există suficiente mijloace prin care putem „repara” aceste disfuncţionalităţi. În realitate. prin intermediul căreia să depistăm caracteristicile distribuţiei. Orice prelucrare mai avansată de date începe cu statisticile descriptive şi este absolut necesară o asemenea analiză exploratorie pentru a vedea care sunt caracteristicile şirului nostru de date şi ce indicatori putem folosi. vom amâna tratarea acestora pentru un capitol viitor. acestea nu sunt scoruri extreme. ci problema se referă tocmai la faptul că există mai multe categorii de salarizare în acea instituţie. se poate defecta. putem constata apariţia unor valori extreme ca efect al dopajului. iar dacă acestea sunt inadecvate prelucrărilor necesare. măsurând performanţele unor sportivi. sub aspectul variabilei măsurate. iată.  Indiferent de sursa de eroare. Erorile de măsurare se datorează unor măsurători incorecte sau apariţiei unor situaţii anormale în condiţiile experimentale. să impunem măsuri corective. cu excepţia situaţiei defectării unor aparate sau a design urilor de cercetare defectuoase. Din fericire. Programul SPSS ne pune la dispoziţie. este absolut necesară analiza preliminară a datelor.

apelăm la meniul „Analyze”. discutam despre faptul că indicatorii tendinţei centrale (şi nu numai ei) pot fi obţinuţi prin mai multe metode.24 – Meniul de analiză exploraintermediul căreia putem stabili analizetorie a datelor le de date ce vor fi efectuate. În acest moment. apoi la submeniul „Descriptive Statistics” şi în final utilizăm opţiunea „Explore…”.25 – Configurarea variabilelor în analiza variabilelor din baza de date şi descriptivă exploratorie apăsarea butonului de transfer. Să nu ne grăbim însă şi să studiem mai atent această fereastră. Atunci am analizat numai opţiunea „Frequencies…” şi am promis că celelalte modalităţi vor fi studiate cu altă 121 . Avem mai multe elemente noi în această fereastră.Cristian Opariuc-Dan IV. În primul rând. Într-un capitol anterior. prin selectarea ei din lista Figura 4. ceea ce ne spune că putem face imediat prelucrarea datelor. la statistici descriptive şi la analize exploratorii. se deschide o fereastră nouă prin Figura 4.3. Efectuând clic pe această opţiune. Pentru a realiza acest lucru. Iată o nouă ancoră mnemotehnică care ne spune că ne aflăm în analiza datelor.1 Obţinerea graficelor pentru tendinţa centrală în SPSS Vom rămâne la baza noastră de date IQ şi ne propunem să obţinem aceste grafice folosind programul SPSS. caseta „Dependent List:” care se referă la variabilele ce vor fi incluse spre analiză. În această casetă vom include variabila noastră şi anume „Vârsta subiecţilor”. se activează şi butonul „OK”.

Atât această listă. În secţiunea „Display”. cât şi elementul „Label Cases by:” vor fi studiate atunci când vom clarifica conceptele de variabilă dependentă şi variabilă independentă. În vederea confirmării acţiunii Figura 4. situată imediat sub lista variabilelor din baza de date. am selectat opţiunea „Both”. de aceea. respectiv cele mai mici (extremele). Putem Figura 4. La apăsarea acestuia va apărea următoarea fereastră: Sunt mai multe opţiuni aici. noi vom bifa doar opţiunea de calcul a statisticilor descriptive. „Outliers” afişează primele cinci valori cele mai mari.Statistică aplicată în ştiinţele socio-umane ocazie. astfel încât le vom ignora pe moment. Menţionăm doar că „Mestimators” reprezintă o alternativă la media şi mediana eşantionului. De asemenea. Butonul „Statistics…” permite afişarea statisticilor descriptive care vor fi calculate. Iată că a venit şi momentul acesta. Noi vom dori să afişăm toate aceste date şi. Caseta „Factor List:” se referă la variabile categoriale ce pot fi utilizate în vederea grupării analizei în funcţi e de anumite criterii. putem stabili ce fel de rezultate să se afişeze în fereastra de rezultate. iar „Percentiles” permite calculul unor valori percentile.27 – Configurarea graficelor noastre. „Descriptives”. Secţiunea „Confidence interval for Mean:” se referă la intervalul de încredere la care va fi calculată media. celelalte opţiuni nu ne interesează deocamdată. însă.26 – Stabilirea indiopta pentru afişarea doar a rezultatelor prelucrăcatorilor statistici rilor statistice („Statistics”). va trebui să apăsăm butonul „Conexploratorii tinue” pentru a reveni la fereastra anterioa- 122 . pentru afişarea doar a graficelor („Plots”) sau a ambelor („Both”). Asupra acestui aspect vom reveni. într-un alt capitol.

Evident. Tabel 4.0% 30 100. Nu ne rămâne acum decât să apăsăm butonul „OK” pentru a lansa procedurile de analiză.27 31. Şi aici avem mai multe informaţii. Acţionarea butonului „Plots…” determină afişarea unei alte ferestre.116 -. adică va fi afişat graficul „tulpină şi frunze”. situată în partea stângă-sus.00 30. bifând caseta „Histogram”. În fereastra de rezultate avem acum mai multe tabele şi grafice. Dev iation Minimum Maximum Range Interquart ile Range Skewness Kurt osis Lower Bound Upper Bound St at ist ic 29. alegând „Factor levels together” sau putem combina mai multe variabile incluse în lista variabilelor independente alegând opţi unea „Dependents together”.427 . Desigur. În cazul nostru. obţinem acelaşi efect. pe oricare dintre primele două opţiuni am alege-o.506 5.33 29. Pentru început observăm că este bifată caseta „Stem-andleaf”.008 .Cristian Opariuc-Dan ră. nu avem nici un caz lipsă (Missing) 123 .0% 0 .1 – Sumarul cazurilor Case Processing Summary „None”. adică 30 de subiecţi ce au date completate pentru variabila „Vârsta subiecţilor”.2 – Descriptives Statistici descriptive Varst a subiectilor Mean 95% Conf idence Interv al f or Mean 5% Trimmed Mean Median Variance St d.833 În tabelul „Case Processing Summary” ne sunt prezentate numărul de cazuri. permite configurarea modului de calcul al graficului „cutie cu mustăţi” discutat anterior. De asemenea. Putem opta pentru combinarea nivelurilor variabilei categoriale (dacă am inclus vreuna în fereastra anterioară). ceea ce reprezintă un procent de 100%. Secţiunea „Boxplots”. Părăsirea acestei casete va fi făcută tot prin apăsarea butonului „Continue”. Aflăm că avem 30 de cazuri valide. vom afişa şi histograma. selectând opţiunea Tabel 4. Cases Valid Missing Total având doar o singură variaN Percent N Percent N Percent Varst a subiect ilor 30 100.878 St d. putem renunţa la afişarea acestui grafic. care va configura modul de prezentare grafică a datelor.33 27.0% bilă inclusă spre analiză.523 20 39 19 10 . Error 1.40 29.

. pentru a oferi o bună reprezentare a datelor.Statistică aplicată în ştiinţele socio-umane şi. . pe care l-am discutat anterior. legate de eroarea standard a mediei. Într-adevăr. . 28-29 ani şi aşa mai departe).00 3. . . analizând acest grafic. un procent de 0%.00 1. Remarcăm cu uşurinţă media (Mean) egală cu 29. abaterea standard şi numărul de cazuri şi. sunt deci 30 de cazuri ce reprezintă un procent de 100%. . . Iată că.00 3.00 2. Sunt mult mai multe informaţii aici. 24-25. intervalul de încredere al acesteia. însoţită de o serie de date statistice cum ar fi media. Urmează apoi histograma pentru variabila „Vârsta subiecţilor”. Observăm că din acest tabel lipseşte modul. .00 5. . iată. precum şi indicatori ai dispersiei pe care-i vom studia în alt capitol. 2223.00 . Leaf 001 44444 666 899999 0111 2 455 77 889 10 1 case(s) 39 Observăm că acest grafic a fost creat din doi în doi (20-21. În total. folosind această opţiune nu putem calcula modul. putem afirma că 36 33 30 27 24 21 Varsta subiectilor Figura 4.00 6.00 4. Următorul tabel este acela al statisticilor descriptive („Descriptives”). corespunzător.28 – Graficul box-plot 124 .00 Stem width: Each leaf: Stem & 2 2 2 2 2 3 3 3 3 3 .33 ani şi mediana (Median) egală cu 29 de ani. 26-27. graficul „tulpină şi frunze”.00 3. Varsta subiectilor Stem-and-Leaf Plot Frequency 3.

deocamdată. graficul „cutie”. Pentru a fi siguri de acest lucru. privim următorul grafic.Cristian Opariuc-Dan cei mai mulţi subiecţi au vârste de 28 şi 29 de ani şi nu există scoruri extreme. Constatăm lipsa scorurilor extreme. că aceste date permit utilizarea mediei ca indicator al tendinţei centrale pentru setul nostru. 125 . mediana fiind situată la valoarea 29 şi o distribuţie destul de uniformă a acestor rezultate. Putem afirma.

3 Obţinerea indicatorilor împrăştierii în SPSS Pentru a studia modul în care aflăm indicatorii dispersiei în SPSS. 2006):  Un coeficient de variaţie mai mic de 15% indică un grad de împrăştiere redus.sav”. două distribuţii diferite.   V. vom folosi. tot comanda Figura 5. pe care am studiat-o în momentul în care am aflat cum putem calcula indicatorii tendinţei centrale. apoi submeniul „Descriptive frecvenţelor Statistics” şi opţiunea „Frequencies…”. Există anumite reguli care permit aprecierea gradului de împrăştiere a scorurilor în jurul mediei. sub aspectul variabilităţii. variabila „Varsta subiectilor”. în care avem deja datele introduse în capitolul anterior. Şi de data aceasta. Un coeficient de variaţie cuprins între 15% şi 30% arată o împrăştiere moderată. utilizându-se acest coeficient (Popa. Un coeficient de variaţie de peste 30% arată o împrăştiere mare.4 – Includerea variabilei în bilelor din baza de date în lista variabianaliză 146 . pentru aceasta. variabilă pe care o vom transfera din lista variaFigura 5. Folosim. ca exemplu. vom folosi baza de date „IQ. media nemaifiind un bun indicator pentru tendinţa centrală. caz în care reprezentativitatea mediei este satisfăcătoare.Statistică aplicată în ştiinţele socio-umane poate fi folosit în situaţii în care comparăm. Se va deschide binecunoscuta de acum fereastră.3 – Meniul de analiză a „Analyze”. media fiind un bun indicator al tendinţei centrale.

4. bifând caseta „Variance” sau amplitudinea de variaţie cu ajutorul casetei „Range”.Cristian Opariuc-Dan lelor supuse analizei („Variable(s)”) din partea dreaptă a formularului. varianţa. Vom putea calcula abaterea standard. 147 . revedeţi capitolul 3. după cum puteţi observa în figura de mai sus. afişarea abaterii standard. secţiunea destinată calculului indicatorilor dispersiei (secţiunea „Dispersion”). prin bifarea casetei Std. în partea din stânga-jos a acestei ferestre. cunoscută de la calculul indicatorilor tendinţei centrale.5 – Selectarea indicatorilor împrăştierii distribuţia noastră prin bifarea casetelor „Minimum” şi „Maximum”. va trebui să comunicăm aplicaţiei SPSS să ne calculeze indicatorii împrăştierii. minimului şi maximului. este posibilă afişarea valorii minime şi maxime din Figura 5. se va deschide o nouă fereastră. deoarece procedeul a fost descris pe larg în capitolul destinat indicatorilor tendinţei centrale. însă asupra acestui element vom reveni ceva mai târziu. Asupra modului în care se face acest transfer nu mai insistăm. Dacă nu vă puteţi aminti. deviation”. De asemenea. a varianţei. amplitudinii distribuţiei. Observăm. După transfer. Vă amintiţi probabil că acest lucru îl putem face apăsând butonul „Statistics…” situat în partea de jos a acestui formular. Imediat.E mean”).6 – Indicatorii împrăştierii Vom alege. Apăsăm apoi butonul „Continue” pentru ca SPSS să memoreze comenzile noastre şi ne întoarcem în formularul anterior. Secţiunea permite şi calcularea erorii standard a mediei (caseta „S. pentru a lansa procedeul de analiză. Nu ne mai rămâne decât să apăsăm butonul „OK”. Tabel 5. aşa cum se poate observa în figura 5.

506). o Abaterea mediană. Media şi abaterea standard sunt indicatorii pe baza cărora se caracterizează o di stribuţie normală.523. o Coeficientul de variaţie. De asemenea. SPSS va afişa în fereastra de rezultate tabelul cu rezultatele comandate de noi.506. Pare mult mai simplu decât să efectuăm manual calculele prezentate la începutul acestui capitol. Cu alte cuvinte. o Intervalul cuartil şi abaterea cuartilă. iar varianţa (Variance) este 30. Aflăm. Aflăm. o Dispersia sau varianţa. o Oscilaţia absolută şi relativă. Dacă veţi extrage rădăcina pătrată din varianţă (30. între Minimum 20 şi Maximum 39 pot exista cel mult 19 valori posibile. Missing=0). ceea ce confirmă teoria expusă mai sus.523). amplitudinea de variaţie (Range) este 19. veţi obţine exact valoarea abaterii standard (5. Indicatorii elementari ai împrăştierii sunt: o Amplitudinea de variaţie absolută şi relativă.Statistică aplicată în ştiinţele socio-umane După câteva fracţiuni de secundă. este necesar să studiem şi modul în care rezultatele se „împrăştie” în jurul tendinţei centrale prin calculul indicatorilor dispersiei. o Abaterea standard. Indicatorii dispersiei bazaţi pe medie pot fi calculaţi numai dacă nivelul de măsurare al variabilei este cel puţin unul de interval şi nu există scoruri extreme în distr ibuţie. niciunul dintre aceşti subiecţi nu are necompletată valoarea pentru variabila vârstă. Iată de ce SPSS îşi merită cu prisosinţă banii pe care îi solicită producătorul… În concluzie:     Dincolo de tendinţa centrală. că abaterea standard (Std. din analiza acestui tabel. o Abaterea medie. că avem un număr de 30 de subiecţi (N=30) şi toţi subiecţii au valori pentru variabila „Varsta subiectilor” (Valid=30. Indicatorii dispersiei pot ţine seama doar de anumite date şi se numesc indicatori elementari ai împrăştierii sau de toate datele. cazul indicatorilor sintetici. Indicatorii sintetici ai împrăştierii sunt: o Diferenţa medie Gini. Automat. SPSS include şi numărul de cazuri (N). în continuare. Deviation) este 5. cu alte cuvinte.   148 .

vom accesa apoi butonul Statistics… pentru a comunica programului SPSS ce fel de statistici să calculeze. pentru a putea analiza forma acestei distribu- Figura 6. Apare cunoscuta casetă de dialog. VI. în momentul în care intenţionaţi să-l folosiţi sau să-l distribuiţi. Figura 6. Alături de indicatorii tendinţei centrale (media. Desigur.sav. a venit momentul aplicării practice a cunoştinţelor dobândite prin analiza unei distribuţii de date efectuată în SPSS. Nu uitaţi să ţineţi cont de regulile elaborării unui etalon.15 – Configurarea inventarului statistic de bază 189 . de unde vom include spre analiză variabila „iq”. baza de date IQ. mediana şi mod) şi de cei ai dispersiei (abaterea standard. Vom selecta din meniul Analyze… opţiunea Descriptive Statistics… şi apoi Frequencies…. minimul şi maximul). amplitudinea distribuţiei. Etapele le ştiţi deja. Vom utiliza aceeaşi bază de date pe care am creat -o la începutul acestui volum. vom include şi cei doi indicatori ai distribuţiei (Skewness şi Kurtosis).14 – Includerea variabilei spre analiză.Cristian Opariuc-Dan Etalonul se scrie la fel ca un etalon în cuantile şi are aceeaşi semnificaţie. Ne propunem să analizăm modul în care se distribuie scorurile obţinute de cei 30 de subiecţi la variabila iq (Coeficientul de inteligenţă).7 Analiza distribuţiei şi realizarea etaloanelor în SPSS După abordarea teoretică a distribuţiei normale.

SPSS a memorat operaţiunile pe care trebuie să le execute. Este normal să reprezentăm genul biologic al subiecţilor printr-o plăcintă. atunci când dorim să vedem compoziţia datelor şi când numărul de valori pe care le ia variabila nu este prea mare. După selectarea adecvată a acestor elemente. În acest moment. putem apăsa butonul Continue şi revenim la fereastra iniţială a alegerii variabilelor. coordodatelor natori de licenţă. Este însă absurd să 190 . Este din nou normal să reprezentăm prin plăcintă gradele didactice dintr-o universitate. profesori univerFigura 6. ba mai mult.16 – Alegerea graficului cu bare pentru reprezentarea sitari de psihologie experimentală. Această fereastră o cunoaştem destul de bine din capitolele anterioare. De nenumărate ori mi-a fost dat să văd studenţi care reprezintă o variabilă continuă printr-o diagramă de structură (grafic tip plăcintă). deoarece vorbim în acest caz de X% bărbaţi şi Y% femei. Variabila are doar două niveluri. O reprezentare prin diagramă de structură se face în cazul unor date nominale sau cel mult ordinale. Motivul pentru care am abordat-o din nou este acela că. Pentru aceasta. care solicită studenţilor reprezentarea variabilelor continui printr-un asemenea procedeu. iar această reprezentare oferă indicii clare asupra compoziţiei unui eşantion.Statistică aplicată în ştiinţele socio-umane ţii şi a decide dacă distribuţia poate fi considerată sau nu o distribuţie normală. deoarece variabila are cinci grade de intensitate. trebuie să facem nişte precizări suplimentare. pentru a reprezenta grafic anumite date. putem accesa butonul Charts… şi se va deschide fereastra de definire a graficelor pentru setul de date. Este uneori util să afişăm şi un grafic al distribuţiei datelor noastre.

17 – Alegerea histogramei pentru reprezentarea datelor În figura 6. iar demonstraţiile se fac cu cifre. vom prefera graficul cu bare. Foarte mulţi psihologi experimentalişti. Prin urmare. Acesta nu este însă un motiv în condiţiile în care dorim să avem o viziune analitică a scorurilor.16. am optat pentru reprezentarea prin histogramă. variabilă continuă. deoarece. Este adevărat că SPSS efectuează automat o grupa re a acestor date în intervale pe care le alege singur. cu o infinitate de valori. În nici un caz nu vom utiliza diagrame de structură sau alte tipuri de diagrame. SPSS oferă o metodă de estimare grafică a curbei de distribuţie. chiar dacă acestea arată frumos. Nu este atât de grav în comparaţie cu reprezentarea prin diagrame de structură. din contra. însă probabil vă amintiţi de faptul că histograma reprezintă dat ele grupate în intervale. Unii chiar se rezumă la a interpreta distribuţia datelor după aspectul grafic al acestei curbe – să fim serioşi. reprezintă o variabilă continuă prin histogramă. Figura 6. iar în figura 6. am ales modul de reprezentare al unui grafic cu bare. Vom analiza ulterior ambele tipuri de grafice şi vom învăţa câteva metode de „cosmeti- 191 . folosind acest procedeu.17. nu cu imagini şi aprecieri subiective pe baza acestora. ci. însă are avantajul estimării vizuale a curbei de distribuţie. Un asemenea grafic nu ne spune nimic. induce distorsiuni care ne creează o imagine falsă asupra datelor. care au rutină în analiza datelor. care ne oferă o viziune fină asupra modului în care datele se distribuie sau graficul tip histogramă.Cristian Opariuc-Dan reprezentăm grafic prin plăcintă vârsta unor subiecţi. pentru a reprezenta grafic o variabilă continuă. care prezintă datele într-un mod mai grosier. statistica este totuşi o disciplină matematică. atunci când discutăm despre distribuţie.

Tabel 6. Utilizând Median 108.116 .8 – Inventarul statistic de bază Statistics Unimodalitatea este uşor de observat.50 Mode 124 numai acest tabel. O distribuţie normală este o distribuţie unimodală. afişat la subsolul tabelului cu o notă. astfel încât imaginile noastre să prezinte şi un aspect el egant.833 Cred că vă mai amintiţi condiţiRange 24 Minimum ile pe care trebuie să le îndepli100 Maximum 124 nească o distribuţie pentru a putea fi considerată normală. cel mai important tabel este tabelul Coef icientul de inteligent a Statistics.833 19 20 39 a. Error of Skewness Kurtosis St d. Dev iation Skewness St d.33 29. Error of Kurtosis . Indiferent de tipul de grafic ales (cu bare sau histogramă). va fi afişată fereastra de rezultate (Output) în care regăsim prezentate informaţiile solicitate. Dev iation 8.33 statistici de start.878 . În câteva secunde. Error of Kurtosis Range Minimum Maximum Valid Missing 30 0 29. toate configurările fiind realizate.Statistică aplicată în ştiinţele socio-umane zare” a graficelor. vom apăsa din nou butonul Continue pentru a reveni la fereastra iniţială. Acest mesaj Varst a subiect ilor N Mean Median Mode St d. numit şi inventarul N Valid 30 Missing 0 statistic de bază sau indicatorii Mean 111.523 . SPSS raportează un mesaj de genul „Multiple mod exist. nu ne rămâne decât să apăsăm butonul OK pentru a comunica programului SPSS să efectueze analiza. de obicei a în dreptul valorii modului.413 dacă distribuţia noastră este sau St d. The smallest value is shown”.00 24a 5. În acest moment.384 St d. Kurtosis -1.511 Skewness . Multiple modes exist. Error of Skewness . putem decide St d. În această fereastră.427 nu este o distribuţie normală.9 – Inventarul statistic de bază Statistics mezocurtică. The smallest v alue is shown 192 .427 -. simetrică şi Tabel 6.

unde am analizat distribuţia aceloraşi 30 de subiecţi în funcţie de variabila vârstă.0 70.3 3. Simetria sau oblicitatea este dată de valoarea indicatorului Skewness. au aceeaşi frecvenţă.0 loana Frequency).7 6.7 16.0 100.7 6.3 3. Observăm că valoarea 29 de ani are aceeaşi frecvenţă şi că nu există o altă valoare cu această frecvenţă maximă. În inventarul statistic alăturat.7 16.3 60.3 3.0 căuta în distribuţia statistică (al 24 5 16.0 10.7 6. renunţând la un subiect care are vârsta de 24 sau 29 de ani). reprezintă 24 de ani. Pentru a afla tipul distribuţiei sub aspectul modalităţii şi Cumulat iv e Frequency Percent Valid Percent Percent a vedea toate valorile mod.7 39 1 3. Total 30 100. distribuţia scorurilor subiecţilor la variabila coeficient de inteligenţă este o distribuţie unimodală.7 56.7 6. Nu putem şti.0 31 3 10.7 90.7 6.7 se regăseşte în cinci cazuri (co35 2 6.7 96.7 zultate) valoarea 24. acest indicator are valoarea zero pentru o dis- 193 . cu modul de 24 şi 29 de ani. La modul teoretic.0 36.0 nostru.7 26. Strict vorbind.Cristian Opariuc-Dan ne comunică faptul că programul a identificat mai multe valori mod şi că o afişează pe cea mai mică.3 37 2 6.0 10.3 3.3 100. În cazul 30 1 3.7 26 3 10. observăm că valoarea 24 32 1 3. Aşadar. vom Valid 20 2 6.0 mai mari de 24.3 73. o distribuţie multimodală nu este o distribuţie normală.3 3. Analiza noastră ar trebui să se oprească aici şi să folosim tehnici de eliminare a acestei anomalii (în cazul nostru. Nu trebuie 38 2 6.10 – Identificarea valorilor mod Totuşi. dacă distribuţia este bimodală.7 doilea tabel din fereastra de re28 1 3.7 83.3 10. distribuţia vârstei subiecţ ilor este o distribuţie bimodală. deocamdată. avem un exemplu de distribuţie multimodală.3 76.7 21 1 3.0 29 5 16. vom trece la următoarea etapă şi anume analiza simetriei. trimodală sau prezintă mai multe valori ale modului. Varsta subiectilor Tabel 6. în cazul nostru.3 3. În acest caz.3 34 1 3.3 40. Tot ceea ce ştim este că cea mai mică valoare mod.0 acum decât să vedem ce valori.

aplicabilă şi pentru boltire.96. O asemenea valoare este însă aproape imposibil de regăsit în practică.Statistică aplicată în ştiinţele socio-umane tribuţie perfect simetrică. acest indicator va avea valori diferite de zero. Întotdeauna. iar eroarea standard Skewness este de 0. valoarea Skewness este de 0. negativă sau pozitivă. Pentru un eşantion mai mic de 30 de subiecţi. Valoarea obţinută de 0. O altă metodă (Sava. Una dinte metode. 2004). iar pentru eşantioane mai mari sau egale cu 30 de subiecţi. 2004) valabilă în cazul eşantioanelor medii şi mici.42=0. există două praguri ale lui z în funcţie de valorile obţinute (Sava. În acest caz. se bazează pe calcului cotei „z” a indicelui de oblicitate Skewness. Cu alte cuvinte. împărţim valoarea indicelui de oblicitate la valoarea erorii s tandard a acestuia. iar eşantionul este de doar 30 de persoane. valoarea pragului de semnificaţie este de 1. acest prag are valoarea de 1.96. Această metodă se foloseşte şi în cazul boltirii.97. Există mai multe metode de verificare a asimetriei.41:0.42. Valorile pentru Skewness mai mici de -0. putem considera distribuţia ca fiind simetrică. chiar dacă nu s-a respectat cerinţa unui eşantion mare.41.80 sau mai mari de 0. pragul de semnificaţie al lui z este de 1. valabilă pentru eşantioane mari (peste 200 de subiecţi).97 fiind mai mică decât pragul. În cazul nostru. v aloarea Skewness este de 0. prin intermediul cărora putem decide dacă o distribuţie poate sau nu poate fi considerată sim etrică. 2004). Făcând raportul 0. ia în considerare stabilirea intervalului de încredere al simetriei în baza erorii standard 194 . Prin această metodă.41. fie în sens negativ – distribuţie asimetrică negativ cu tendinţe către scoruri mari. putem considera distribuţia scorurilor ca fiind o distribuţie simetrică. A treia metodă propusă.58. Cum eşantionul nostru este de 30 de subiecţi. este reprezentată de reperul propus de Lewis-Beck (Sava.80 indică o asim etrie clară. fie în sens pozitiv – distribuţie asimetrică pozitiv cu tendinţe către scoruri mici. În cazul nostru.

42 … +0. iar la un nivel de precizie de 95% este cuprins între -0. distribuţia ca fiind simetrică. Eroarea standard Skewness ne oferă limitele între care trebuie să se regăsească coeficientul de oblicitate. cât şi în al doilea interval. valoarea coeficientului de oblicitate Skewness este de 0. distribuţia noastră poate să se comporte ca o distribuţie asimetrică. Intervalul este determinat de ± o eroare standard Skewness. distribuţia poate fi considerată simetrică. Un asemenea interval este mai puţin precis în comparaţie cu primul şi se foloseşte când simetria nu reprezintă un element critic pentru distribuţia datelor.84. cu alte cuvinte în mai puţin de 1% din cazuri. Intervalul este determinat de ± două erori standard Skewness. La acest nivel. astfel încât să putem considera. Dacă valo area coeficientului de oblicitate iese din acest interval la limita negativă. distribuţia noastră poate să se comporte ca o distribuţie asimetrică. cu alte cuvinte în mai puţin de 5% din cazuri. Un asemenea interval este foarte precis şi se foloseşte atunci când simetria reprezintă un element critic pentru distribuţia datelor.41) intră atât în primul interval. există două tipuri de intervale:  La un nivel de precizie de peste 99%.84 … +0. În situaţia noastră. La un nivel de precizie de peste 95%. cu şanse 195 .42. distribuţia este asimetrică pozitiv. Intervalul de î ncredere la un nivel de precizie de 99% este cuprins între -0.  Dacă valoarea coeficientului de oblicitate Skewness intră într-unul dintre aceste intervale. avem de-a face cu o distribuţie asimetrică negativ. Putem constata cu uşurinţă că valoarea coeficientului de oblicitate Skewness (0.42.41 iar valoarea erorii standard Skewness este de 0. la un nivel de precizie suficient de mare. Putem aşadar afirma. iar dacă iese din interval la limita pozitivă.Cristian Opariuc-Dan Skewness şi poate fi utilizată indiferent de mărimea eşantionului.

de a se răspândi. iar pentru un nivel de precizie de 95% între -1. A tr eia metodă. Boltirea sau excesul reprezintă tendinţa rezultatelor de a se concentra în jurul mediei (distribuţia ascuţită sau leptocurtică) sau.61. obţinem nota z pentru Kurtosis de 1. putem aprecia că suntem în faţa unei distribuţii mezocurtice. Mai rămâne să demonstrăm că este o distribuţie mezocurtică. disipa puternic în jurul mediei (distribuţia platicurtică). pentru a decide faptul că scorurile la coeficientul de inteligenţă se distribuie normal.83.83. la fel ca şi în cazul simetriei. pentru care nu intrăm în detalii. 1. Am arătat până acum că distribuţia scorurilor subiecţilor la variabila coeficient de inteligenţă este o distribuţie unimodală şi simetrică. datorită viziunii extrem de precise pe care o oferă. Haideţi acum să analizăm boltirea prin prisma celei de-a treia metode.66.34 196 .83 … +0. Anal iza boltirii se poate face prin a doua sau a treia metodă expusă anterior.96.83= 1. din contra.66 … +1. indicatorul care ne dă mărimea acestei împrăştieri este Kurtosis. Pragul de semnificaţie pentru eşantionul nostru este. am decis că distribuţia scorurilor celor 30 de subiecţi la coeficientul de inteligenţă este o distribuţie simetrică.Statistică aplicată în ştiinţele socio-umane mai mici de 1% ca distribuţia noastră să se comporte asimetric. Intervalul de încredere la un nivel de precizie de 99% este cuprins între -0. că avem de a face cu o distribuţie simetrică. v-o recomand să o folosiţi ori de câte ori analizaţi simetria sau boltirea unei distribuţii. Observăm că valoarea Kurtosis de -1.34 şi eroarea standard a acestui coeficient de 0. pentru a vedea diferenţa de precizie. După cum ştim.34:0. Utilizând a doua metodă. Valoarea notei „z” pentru Kurtosis fiind mai mică decât pragul de semnificaţie. Distribuţia scorurilor celor 30 de subiecţi la variabila coeficient de inteligenţă prezintă coeficientul de boltire Kurtosis de -1. Indiferent de metoda folosită.

simetrică şi mezocurtică am demonstrat de fapt că distribuţia respectă toate caracteristicile unei distribuţii gaussiene şi poate fi considerată o distribuţie normală. Valorile coeficientului de boltire Kurtosis negative şi care ies din intervalul de încredere sunt reprezentative pentru o distribuţie platicurtică. indicatorii tendinţei centrale şi ai împrăştierii. În situaţia în care excesul nu este un element atât de important. indi- 197 . numărul de cazuri. Vă rog să aveţi în vedere ataşarea exactă a inventarului statistic de bază din SPSS şi a eventualelor grafice care vă pot susţine demonstraţia. deoarece. cât mai multe informaţii legate de variabila dumneavoastră. va trebui să precizaţi: denumirea variabilei analizate. Într-o analiză de date. Dacă avem de a face cu valori pozitive care ies din intervalul de încredere. Pentru a concluziona.Cristian Opariuc-Dan intră într-al doilea interval (cu precizie mai mică) însă nu şi în primul interval (de mare precizie). Analiza distribuţiei trebuie să preceadă orice analiză ulterioară de date. distribuţia este leptocurtică. în situaţia în care eterogenitatea sau omogenitatea scorurilor în jurul mediei este un element important. Deci. Demonstrând faptul că distribuţia scorurilor celor 30 de subiecţi la variabila coeficient de inteligenţă este o distribuţie unimodală. Întotdeauna furnizaţi. vă voi oferi un model complet de analiză a distribuţiei scorurilor în funcţie de variabila coeficient de inteligenţă. în analiză. deoarece nu intră în intervalul cu precizie mare. în funcţie de normalitatea distribuţiei. pot fi alese statisticile parametrice sau nonparametrice utilizabile pe parcursul demersului de cercetare. în ştiinţele sociale nivelul de precizie acceptat este de peste 95%. Oricum. vom considera distribuţia noastră ca fiind o distribuţie platicurtică. putem considera distribuţia ca fiind mezocurtică. astfel încât distribuţia noastră poate fi considerată o distribuţie mezocurtică. după asumpţiile teoretice ale fiecărei metode în parte.

Statistică aplicată în ştiinţele socio-umane catorii distribuţiei şi explicarea acestora în cazul unor distribuţii asimetrice. şi ce înseamnă acel tabel şi acea figură. Amplitudinea distribuţiei este de 24 scoruri IQ cuprinsă între un minim de 100 IQ şi un maxim de 124 IQ. Dev iation Skewness St d. simetrică (Skewness=0. Eroarea standard Kurtosis=0.41. figura numărul…. validă în orice comunicare ştiinţifică naţională sau internaţională.5 IQ şi abaterea standard 8. Mulţi vor spune că nu e chiar profesional.427 -1. Error of Kurtosis Range Minimum Maximum 30 0 111.384 .51 IQ. Error of Skewness Kurtosis St d. Eroarea standard Skewness=0.833 24 100 124 Distribuţia rezultatelor celor 30 de subiecţi la variabila „Coeficient de inteligenţă” este o distribuţie unimodală (modul=124 IQ). Oricum.33 108. cu media 111. graficele sub forma graficului cu bare sau histogramă. Iată un exemplu complet şi profesional prin care puteţi realiza o anal iză a distribuţiei datelor.83). iar aceste 198 .42) şi mezocurtică (Kurtosis=-1. mă adresez unor oameni inteligenţi. Având în vedere aceste elemente.413 . că trebuia să specific tabelul numărul ….38. platicurtice sau leptocurtice. Asemenea lucruri ţin de normele de redactare a documentelor ştiinţifice elaborate APA şi vi le las ca studiu. deoarece nu intenţionez să le abordez în prezenta lucrare. această variabilă suportând proceduri parametrice de analiză statistică.511 . tabelele valorice ale inventarului statistic de bază. putem considera că scorurile obţinute de cei 30 de subiecţi se distribuie normal în cazul variabilei „Co eficient de inteligenţă”.33 IQ.50 124 8. mediana 108. Statistics Coef icientul de inteligent a N Valid Missing Mean Median Mode St d.

că pot să fiu acuzat că am copiat şi lipit în document tabele şi grafice din SPSS fără să le traduc în româneşte. este posibil să se afişeze o bară de instrumente de editare. Cel de-al doi- 199 . iar eu doresc să introduc conţinutul lor original. Departe de mine această intenţie. conform aceloraşi norme APA. pentru că SPSS oferă tabelele şi graficele în engleză. Puteţi să faceţi aproape orice cu tabelele şi graficele pe care SPSS le furnizează. utilizarea elementelor furnizate de programe informatice în lucrări ştiinţifice se face prin includerea conţinutului original şi nemodificat. de asemenea. Nici cartea de faţă nu le respectă. În al doilea rând. Observăm că marginea care încadrează acest tabel a devenit o margine haşurată şi. Deschizând o paranteză. tabelul Statistics. Figura 6. desigur. În primul rând. Nu aveţi decât să daţi un dublu clic pe elementul pe care doriţi să-l editaţi şi veţi intra într-un alt mod pe care SPSS îl suportă.Cristian Opariuc-Dan amănunte le ştiţi sau le puteţi afla şi singuri. Orice element din fereastra de rezultate SPSS este un element editabil. modul de editare. pentru că vreau să vă învăţ. cum să editaţi conţinutul elementelor din fereastra de rezult ate.18 – Tabelul Statistics în mod editare Primul buton de pe această bară de formatare permite anularea acţiunilor efectuate (Undo). Pentru început. În al treilea rând. însă prefer să am un stil propriu şi aş fi încântat dacă aţi învăţa din aceste rânduri cum să faceţi efectiv analize de date mai mult decât cum să vă conformaţi unor norme. imediat. să dăm dublu clic pe tabelul inventarului statistic de bază. ştiu. similară celei din programul Microsoft Word.

Cele patru butoane care se succed permit alinierea textului selectat. Următoarele trei butoane permit scrierea îngroşată. fără teamă că aţi putea strica ceva (în definitiv aveţi la dispoziţie butonul de anulare . centrat sau automat. Vă recomand să exersaţi aceste elemente. dacă aţi uitat să o faceţi în etapa de analiză.Undo). Aflându-vă în modul de editare. Pentru început. ne propunem să traducem în româneşte cuvintele Missing (Lipsă). inutil. Figura 6. Mean (Media). Nu vom intra în amănunte legate de formatarea tabelelor. caseta derulantă de alegere a fontului şi caseta derulantă de alegere a dimensiunii fontului pentru textele selectate. Media (Mediana) şi Mod (Modul).20 – Editarea valorilor în tabel 200 . deoarece ar trebui să includem. dreapta. Ultimele două butoane lansează sistemul de asistenţă (help) sau modul de creare a graficelor pentru variabila selectată – iată o altă modalitate de a realiza grafice. înclinată şi sublinierea. iar butonul al patrulea selectează culoarea cu care să fie afişat fontul.19 – Bara de formatare SPSS Urmează apoi o casetă derulantă de aplicare a unui stil tabelului formatat. care permite schimbarea rândurilor şi a coloanelor în tabel. efectuăm din nou dublu Figura 6. la stânga.Statistică aplicată în ştiinţele socio-umane lea buton este butonul „pivot”. Un tabel în modul de editare permite modificarea elementelor componente. mai multe pagini.

în general. Puteţi folosi bara de formatare pentru a îngroşa. dacă apăsaţi orice tastă.833 24 100 124 Figura 6.33 108. trebuie să puneţi la dispoziţie şi baza de date în momentul în care publicaţi un studiu şi de cele mai multe ori analizele sunt refăcute de comisia de publicare a articolului. pot fi modificate şi cifrele. Deplasaţi cursorul mausului deasupra unei linii. „Lipsă”.Cristian Opariuc-Dan clic pe cuvântul Missing. Procedaţi la fel cu toate celelalte cuvinte din tabel.413 . schimba culoarea sau alinia textele selectate. până când se transformă într-o săgeată orizontală.511 . dacă doriţi. Nu vă rămâne decât să scrieţi în loc de Missing. pentru a putea traduce tabelul în limba română.427 -1. Apoi ţineţi apăsat butonul din stânga al mausului şi „trageţi” mişcând mausul la dreapta sau la stânga. Inventar statisti c de baza Coef icientul de inteligent a N Valid Lipsa Media Mediana Modulul Abaterea standard Skewness Eroarea Skewness Kurtosis Eroarea Kurtosis Amplitudinea Minimum Maximum 30 0 111.50 124 8. ceea ce vă poate determina uneori să schimbaţi datele oferite de SPSS cu alte date mai convenabile vouă. la fel cum pot fi traduse cuvintele. Observaţi că textul Missing este deja selectat acum. Iată modalitatea prin care puteţi traduce. conţinutul selectat va fi înlocuit cu tasta apăsată. Când aţi terminat. puteţi ajusta lăţimea coloanelor pentru ca tabelul dumneavoastră să prezinte un aspect elegant. Din nefericire. daţi clic oriunde pe suprafaţa albă a ferestrei de rezultate. Lipsă. tabelul dumneavoastră trebuie să arate la fel ca cel din figura de mai sus. ca în figura alăturată. Tot folosind modul de editare. Cuvântul „Missing” este înlocuit cu textul introdus. orice element al formularului de rezultate într-o altă limbă.384 . Va rezulta o figură similară celei alăturate. pentru a ieşi din modul de editare. Nu uitaţi că.21 – Inventarul statistic după editare În final. 201 .

Acest meniu este un meniu important în formatarea aspectului grafic al tabelului. Puteţi consulta. Meniul Pivot permite marcarea tabelului curent în scopul unei regăsiri rapide în fereastra de rezultate. pentru Figura 6.22 – Inventar statistic tradus informaţii suplimentare. a unei noi etichete în subsolul tabelului sau a unei noi note se subsol într-un mod similar operaţiunii pe care SPSS o face automat în momentul în care depistează o distribuţie multimodală. a fonturilor 202 . La fel puteţi proceda şi pentru ajustarea dimensiunilor pe verticală. a întregului tabel. din considerente de spaţiu. Meniul Format cuprinde un set de utilitare prin intermediul cărora putem modifica aspectul celulelor din tabel. Referitor la formatarea tabelelor. în momentul în care vom discuta despre studiile corelaţionale. în cadrul tabelului selectat. Ne vom limita doar să le pre- zentăm. Meniul Insert permite adăugarea. Vom reveni asupra acestui meniu.Statistică aplicată în ştiinţele socio-umane pentru a ajusta dimensiunea coloanei din tabel. SPSS pune la dispoziţie mai multe meniuri pe care nu le vom analiza în detaliu aici. a unui nou titlu. comutarea tabelului prin inversarea liniilor sau a coloanelor sau lansarea ferestrei speciale prin care poate fi controlată pivotarea tabelului. manualul SPSS. cu aplicaţii în condiţiile analizei unui volum mare de date.

este acela de a crea o nouă variabilă care va stoca scorurile „z” ale fiecărui Figura 6.23 – Meniul statistici descriptive tives… Cunoaşteţi deja fereastra care se deschide. mai multe şabloane grafice care pot fi aplicate tabelelor. pe care o vom bifa. numărul de zecimale pe care SPSS să le afişeze. Este vorba despre caseta de bifare „Save standardized values as variables”. Oricând vă puteţi întoarce la starea iniţială. anterioară unei acţiuni. Se pot stabili. includerea sau excluderea capului de tabel etc. alături de cele expuse mai sus. asemănător progr amului Microsoft Word.1 Calculul notelor „z” în SPSS Programul SPSS permite calculul notelor „z” pentru fiecare dintre cazurile individuale prezente în distribuţia de date. drept pentru care nu vom insista decât asupra unui singur element. veţi alege opţiunea Descriptive Statistics şi apoi opţiunea DescripFigura 6. într-un mod foarte simplu şi elegant. Alegând un asemenea şablon grafic. Analyze.7. Din acelaşi meniu. Vă invit să parcurgeţi acest meniu şi să exersaţi facilităţile pe care le oferă. folosind butonul Undo. deoarece am analizat-o pe parcursul acestei lucrări. Rolul acestei casete. Evident. VI.24 – Fereastra de configurare a analizei caz din baza de date.Cristian Opariuc-Dan sau a notelor de subsol. SPSS conţine. puteţi modifica complet aspectul tabelelor din foaia de rezultate. Toate opţiunile din acest meniu ţin doar de aspectul grafic al tabelelor şi nu afectează în niciun fel conţinutul datelor dumneavoastră. va fi lansată fereastra de afişare a rezultatelor care conţine un 203 . ordonarea datelor.

după ce am introdus variabila „Coeficient de inteligenţă” în lista variabilelor ce trebuie analizate.5 la valoarea notei „z”. al doilea la 1. prin care notele standardizate vor fi salvate ca variabile. adică în zona rezultatelor medii. să ne întoarcem la baza de date.25 – Noua variabilă ce conţine scorurile z Vom folosi serviciile unui alt meniu.01 abateri standard în dreapta mediei.Statistică aplicată în ştiinţele socio-umane tabel pe care l-am discutat deja. Dacă avem notele „z”. Rezultatul acestei acţiuni se concretizează într-o fereastră similară celei alăturate. Totuşi. Este vorba despre variabila „Ziq”. Cum facem totuşi pentru a obţine note standardizate rezultate din notele „z”. care conţine următoarele elemente: Target variable reprezintă secţiunea în care Figura 6. în funcţie de versiunea SPSS pe care o posedaţi. care nu conţine altceva decât notele „z” ale fiecărui subiect.33 abateri standard în stânga mediei. deci. ultima din baza de date. unde sunt notele „z” atât de căutate de noi? Să ne amintim ce am bifat.27 – Fereastra de calcul a variabilelor 204 .26 – Meniul de transformare SPSS Figura 6. şi anume meniul Transform. Am bifat o opţiune. Vă mai amintiţi probabil că scorurile sten se obţin aduadunând valoarea 5. Cum facem însă acest lucru în SPSS? Figura 6. tot în zona scorurilor medii şi aşa mai departe. Trebuie. Observăm că primul subiect se află la 1. scoruri sten spre exemplu. restul este simplu. de unde vom selecta opţiunea Compute sau Compute variable…. unde vom regăsi o nouă variabilă creată automat.

Cristian Opariuc-Dan vom introduce numele variabilei destinaţie, variabilă în care se vor salva noile rezultate. În cazul nostru, suntem interesaţi să calculăm scorurile sten pe ntru variabila „iq” şi vom introduce un nume, ca spre exemplu „StenIQ”. Sub această casetă de text se află un buton intitulat Type & Label…, pe care, dacă apăsăm, vom putea configura proprietăţile noii variabile create. Astfel, avem posibilitatea să adăugăm o etichetă variabilei nou create, folosind cele două opţiuni din secţiunea Label. Putem decide dacă introducem un text ca etichetă (ca în cazul figurii alăturate) ori vom folosi drept etichetă formula de calcul, situaţie în care va trebui să alegem opţiunea Use expression as label. Secţiunea Type permite alegerea tipului de variabilă. Putem decide între un tip numeric implicit şi un şir de caractere, caz în care va trebui să includem şi dimensiunea acestui şir, numărul de caractere pe care îl perm ite variabila.
Figura 6.28– Proprietăţi ale variabilei

Sub butonul Type & Label se află binecunoscuta listă a variabilelor din baza de date. În partea dreaptă, apare caseta de text Numeric Expression, cu ajutorul căreia putem scrie formula de calcul prin care va fi obţinută noua variabilă. În acest sens, putem utiliza „calculatorul” de sub casetă sau putem tasta pur şi simplu valorile sau formula în caseta de text. Pentru a vă uşura accesul la formule, SPSS vă pune la dispoziţie două liste: lista Function group care conţine funcţiile sistemului grupate pe categorii şi lista Functions and Special Variables care se referă la funcţiile din categoria selectată anterior. Dacă, de exemplu, în prima listă, efectuăm clic pe elementul Arithmetic, atunci, în cea de-a doua listă, vor fi afişate funcţiile referitoare la operaţiile aritmetice uzuale. Butonul If… permite efectuarea condiţională a calculelor, adică calcularea doar a datelor care îndeplinesc o condiţie.

205

Statistică aplicată în ştiinţele socio-umane

Întâlnim aici posibilitatea de a include toate cazurile (Include all cases) sau de a include doar cazurile care satisfac o condiţie (Include if cases satisfies condition). Dacă, de exemplu, dorim să calculăm scorurile sten doar pentru bărbaţi, vom alege această opţiune, iar apoi vom scrie în caseta de formule expresia „sexul=1”. În acest fel, SPSS va calcula scorurile sten numai pentru bărbaţi, ignorând femeile. Întâlnim şi aici lista de funcţii, utilă pentru crearea unor expresii mai complexe. Deocamdată nu ne interesează niciun calcul condiţional, prin urmare vom părăsi fereastra fără a efectua nicio modificare. Să vedem acum, concret, cum calcu- Figura 6.29 – Calculul condiţional al datelor lăm scorurile sten ale variabilei „iq”, folosind aceste elemente. În primul rând, am introdus numele şi descrierea noii variabile în caseta Target Variable, aşa cum a fost exemplificat mai sus. Ne amintim că nota sten se calculează adunând 5,5 la valoarea notei „z”. Nota „z”, însă, am calculat-o anterior şi o regăsim în baza de date sub denumirea „Ziq (Zscore: Coeficientul de inteligenţă). Restul e simplu. Nu vă rămâne decât să scrieţi în caseta Numeric Expression formula (5,5 + Ziq), fie tastând-o, fie folosind „calculatorul”. Variabila care conţine nota „z” (Ziq) se poate tasta sau se poate folosi butonul de transfer pentru a include variabila din lista variabilelor în formulă.
Figura 6.30 – Calculul scorurilor sten

Nu mai trebuie decât să apăsaţi butonului OK şi să vedem ce se întâmplă. Apare, desigur, fereastra de rezultate care ne informează asupra faptului că operaţiunea a reuşit. La fel ca la calculul notelor „z”, ne interesează baza de date. 206

Cristian Opariuc-Dan Iată că a apărut noua variabilă „StenIQ” care conţine, exact aşa cum am specificat, scorurile sten ale subiecţilor. Observăm că, de această dată, notele nu mai sunt cuprinse între -3 şi +3, ci pe o scală de la 1 la 10, exact ca în sistemul şcolar. Este mult mai intuitiv, nu-i aşa? Ca exerciţiu, vă propun calculul notelor „z” şi a scorurilor sten pentru variabila „vârsta subiecţilor”.

În concluzie:
  Media şi abaterea standard caracterizează pe deplin o distribuţie şi , de aceea, aceşti doi indicatori poartă numele de parametri ai repartiţiei normale; O distribuţie normală trebuie să îndeplinească simultan următoarele trei condiţii: o Să fie unimodală; o Să fie simetrică; o Să fie mezocurtică; Unimodalitatea reprezintă existenţa unei singure categorii cu frecvenţa absolută maximă şi se analizează prin inspectarea valorii modale; O distribuţie normală este o distribuţie unimodală; Simetria reprezintă echilibrarea distribuţiei pe axa orizontală şi se poate calcula prin: o Coeficientul Yule; o Coeficientul Fisher; o Relaţia dintre medie, mediană şi abaterea standard; Referitor la simetrie, există un sistem de relaţii între indicatorii tendinţei centrale (medie, mediană şi mod), distribuţiile putând fi simetrice, asimetrice la stânga şi asimetrice la dreapta. O distribuţie normală este o distribuţie simetrică Boltirea reprezintă o „asimetrie verticală” a distribuţiei şi se poate calcula prin: o Coeficientul de boltire Pearson; O distribuţie normală este o distribuţie mezocurtică; Într-o distribuţie normală, există un număr de şase abateri standard; trei la stânga mediei şi trei la dreapta mediei; În funcţie de abaterile standard, o distribuţie normală prezintă patru zo ne: zona scorurilor normale, zona scorurilor accentuate, zona scorurilor atipice şi zona sc orurilor aberante; Notele „z” reprezintă distanţa dintre un scor particular şi medie , exprimată în termeni de abateri standard;

  

      

207

5 Obţinerea coeficienţilor de corelaţie în SPSS Nu-i aşa că v-aţi săturat de atâtea calcule? Aşa-i că vă este dor de câteva clicuri? Sigur că vorbim despre o diferenţă enormă. I. Variabilitatea datelor în acest caz este mult mai mare. vă va lua sub un m inut. Înainte de a începe. Făcând această incursiune prin analiza graficelor. Pe un lot de cercetare de 200 de persoane. evident. a ajuns la versiunea 17. Din fericire.1 Coeficienţi de corelaţie bazaţi pe date parametrice SPSS for Windows. se ajustează procedurile de calcul şi de raportare. există. Putem intui dreapta de evoluţie a celor două variabile. Legătura.28. deoarece.5. probabil că vă va lua jumătate de zi. Interpretarea exclusivă pe baza coeficientului de corelaţie nu se recomandă. Iată că a venit timpul să studiem corelaţiile folosind cunoscutul pachet de programe. Folosind SPSS for Windows şi presupunând că aveţi deja datele introduse. versiune cu multe îmbunătăţiri şi facilităţi în comparaţie cu variantele anterioare.14. am dorit să subliniem importanţa studiului diagramei de corelaţie. reluând exemplul din capi- 113 . foarte uşor putem cădea în capcana unei relaţii neliniare sau specifice. care presupune o importantă investiţie de timp şi este susceptibil de a genera erori. însă nu are puterea celeia din figura 1. I. SPSS for Windows. însă observaţi că datele sunt mult mai împrăştiate în jurul acesteia. pentru a calcula pe hârtie coeficientul de corelaţie r Bravais-Pearson. vom crea o bază de date nouă. Analiza datelor prin utilizarea creionului şi a hârtiei reprezintă un proces laborios.Cristian Opariuc-Dan Figura 1. în acest moment. În funcţie de aspectul datelor. Primul pas în interpret area coeficientului de corelaţie este analiza diagramei de corelaţie. programele specializate de analiză statistică pot face aceste operaţii în câteva fracţiuni de secundă.15 arată norul de puncte al unei corelaţii negative slabe de 0.

2 Probabil că vă mai amintiţi cum se creează o bază de date în SPSS. Gen 1 2 Masculin Feminin Această bază de date o vom folosi doar pentru studiul coeficienţilor de corelaţie parametrici.2 1 3. Vă reamintesc faptul că am dorit. toate elementele necesare realizării bazei de date găsindu-se în tabelul 1. prezentată în figura 1. în fereastra principală SPSS. Observăm că avem un număr de patru variabile. aprofundarea corelaţiilor neparametrice făcându-se pe baza altor date. Figura 1. înregistrând timpul de studiu (în ore) necesar susţinerii examenului de statistică. Detalii despre aceste procedee puteţi găsi în lucrarea anterioară sau în alte cărţi de specialitate. Realizăm.Statistică aplicată în ştiinţele socio-umane tolul destinat studiului corelaţiilor parţiale. atunci. Valoare Etichetă După realizarea structurii bazei de date.16. să aflăm legătura dintre performanţa la examen şi emoţiile din timpul examenului.35 – Structura bazei de date Variabila Timp Emotii Gen Nota Eticheta Timp de studiu Emotii examen Gen biologic Nota examen Nivel de măsură Scalar Scalar Nominal Scalar Tip Numeric Numeric Numeric Numeric Caractere 2 3. o bază de date cu următoarea structură: Tabelul 1. secţiunea „Data view” veţi avea următoarea structură. prin urmare. Variabila „Gen” este o variabilă nominală cu asocierile din tabelul alăturat. media obţinută la examenul de statistică (nota la examen şi activitatea de s e- 114 .16 – Structura bazei de date Pentru acest studiu.29. am investigat un număr de 103 subiecţi.

30 88.01 43.57 2 6.75 2 9.50 4 91.00 59 57.46 73.91 1 7.00 10.27 1 4.79 2 5.00 13 84.00 1 84.27 2 5.43 65.73 1 7.50 14 67.00 8 84.00 2 10.18 61.00 6 82.73 1 8.16 75.07 1 3.00 11 81.00 8. pe care vă invit să o realizaţi.27 Tabelul 1.10 2 6.00 6.83 1 8.04 91.01 34.50 42 95.50 2.00 Datele sunt fictive şi nu corespund unui studiu real. Ele au fost manipulate în aşa fel încât să corespundă necesităţilor didactice.00 28 86.88 2 8.00 1 6.50 8.55 1 8.50 3.69 1 9.00 6.34 0.50 10 84.00 0.37 82.00 9.76 2 7. nu vă ia mai mult de 10 minute. genul biologic şi scorul obţinut la un instrument de evaluare a emotivităţii în condiţii de examen3.00 4 87.00 42 68.Cristian Opariuc-Dan minar).00 15 91.46 63.50 3 92.00 4.00 2.50 10 83.00 5 84.52 60. Nu este cazul să vă mai explic modul în care veţi introduce datele în SPSS.27 2 2.00 6.52 75.21 2 3.00 10.69 1 7.88 1 7.00 68 20.50 29 63.00 7. 115 .40 Gen 2 1 2 1 2 1 1 2 2 1 2 1 2 1 2 1 2 2 1 2 1 1 2 2 1 2 1 2 2 1 1 2 2 1 Nota 7.00 1 83.66 70.72 70.13 2 5.18 75.51 81.00 7 82.94 2 5.97 2 2.46 2 7.00 12 83.54 80.50 6 84.00 8.58 82.00 10.50 1.00 5.30 2 4.20 5.28 1 9.12 1 2.00 7. Timp 4 11 27 53 4 22 16 21 25 18 18 16 13 18 98 1 14 29 4 23 14 12 22 84 23 26 24 72 37 10 3 36 43 19 3 Emotii 86.71 95.36 – Baza de date „Corelaţii parametrice” Gen Nota Timp Emotii 1 4. După ce aţi introdus datele.00 22 72.82 79.31 89.00 19 73.50 8.70 13 62.13 64.27 79.00 38 50.60 1 4.00 4.46 75.79 81.06 71.00 16 71.00 1.50 2 63.00 8.50 7.50 5 82.00 8.82 69.43 2 9.50 4 93.52 89.00 7.00 4.69 1 8. Mai jos aveţi întreaga bază de date.69 1 6.40 89.69 2 9.69 2 7. Nu vă speriaţi.00 8 87.50 1.00 7.04 80. sa lvaţi fişierul sub numele de „Corelaţii parametrice”.00 6.66 77.00 1.50 8 77.73 27.00 7.

18 – Fereastra corelaţiilor bivariate Figura 1.40 62.27 69.20 4.30 84. deoarece este evident faptul că se situează la un nivel scalar de măsură.00 4.00 7.18.50 2.00 5.69 89.90 7.37 2 1 1 2 1 2 2 1 1 2 2 2 2 1 2 2 1 1 2.25 84.27 79.21 75.24 82.69 75.00 8. să începem cu începutul.50 2.00 3.Statistică aplicată în ştiinţele socio-umane 12 9 72 10 12 30 15 8 34 22 21 27 6 18 8 19 13 79.27 78.79 86.91 71.01 73.00 4.50 3.82 70. Formularul conţine două liste. trebuie să ne asigurăm că cele două variabile îndeplinesc condiţiile de calcul ale statisticilor parametrice.00 7.00 2.00 1.50 0.83 82.00 2 19 11 15 23 13 14 1 9 20 0 52 38 19 23 11 27 17 87.17 – Lansarea procedurii de calcul ale corelaţiilor 116 .50 6.24 72.07 50.50 8.13 93.13 81.50 6.76 75.70 0.50 5.00 5.79 82. Înainte de a ne grăbi să calculăm coeficientul de corelaţie r BravaisPearson.00 8.60 74.00 5.46 83.98 78.00 5.50 0.00 8. Figura 1. Lansarea procedurilor de calcul ale corelaţiilor se realizează prin accesarea meniului „Analyze”.89 53.58 67.98 97.50 8.50 3.04 37.00 În primul rând.55 58.12 1 2 1 1 2 1 1 2 1 2 2 1 1 1 1 2 1 8. Vom presupune că ambele variabile au o distribuţie normală.52 71. Dorim să aflăm dacă există vreo legătură între nota obţinută la examen şi emoţiile din timpul examenului.04 91. Imediat se va deschide o fereastră similară celei din figura 1.82 70. apoi din submeniul „Correlate” vom alege opţiunea „Bivariate…”.00 4.50 7.04 79.00 5.50 8.

05.01. cât şi în cazul unei legături negative. Întrebare Cum aţi formula o ipoteză direcţională în acest design de cercetare? Ce opţiune aţi alege în secţiunea testelor de semnificaţie? Caseta de bifare „Flag significant correlations” comunică programului SPSS să marcheze. coeficientul de corelaţie τ Kendall (Kendall’s tau-b) şi coeficientul de corelaţie al rangurilor ρ Spearman (Spearman). Situaţia noastră este clară. variabilele „Nota examen” şi „Emoţii examen”. în conformitate cu planul de cercetare. în mod distinct. În cazul nostru. Următoarea secţiune. vom calcula coeficientul de corelaţie r Bravais-Pearson. corespunzătoare celor trei coeficienţi de corelaţie ce pot fi calculaţi: coeficientul de corelaţie r Bravais-Pearson (Pearson). am inclus spre analiză. Aplicaţia va marca. corelaţia fiind semnificativă atât în cazul unei legături pozitive. Cu ajutorul acestuia. corelaţiile semnificative. putem transfera variabilele din baza de date (fereastra din stânga) în lista variabilelor supuse analizei (fereastra din dreapta). şi două asteriscuri în cazul corelaţiilor semnificative la un prag de semnificaţie mai mic de 0. Putem alege între o ipoteză nedirecţională (Two-tailed) şi o ipoteză direcţională (One-tailed).19 – Fereastra opţiunilor avansate 117 .Cristian Opariuc-Dan separate prin butonul de transfer în formă de săgeată. Ştiţi deja că aceasta este o ipoteză nedirecţională. Figura 1. folosind un asterisc pentru corelaţiile semnificative la un prag de semnificaţie mai mic de 0. Presupunem că ipoteza noastră vizează stabilirea unei relaţii între performanţa la examen şi emoţiile din timpul examenului. Sub aceste două liste se află secţiunea „Correlation Coefficients”. „Test of Significance” are în vedere stabilirea tipului de ipoteză cu care lucrăm. care conţine trei casete de bifare.

împărţit la numărul gradelor de libertate (în cazul nostru. de fapt. Acest din urmă element se afişează pentru fiecare pereche de variabile supuse analizei. Celelalte butoane vă sunt cunoscute şi nu comportă explicaţii suplimentare. deşi există riscul unor erori statistice. Aceasta este o opţiune mai riguroasă. considerând valoarea lipsă ca fiind valoare nulă. Lansarea procedurilor de calcul se face prin acţionarea butonului „OK”. caz în care se revine la formularul iniţial. valoarea numărătorului din formula de calcul a coeficientului de corelaţie r Bravais-Pearson. În situaţia „Exclude cases pairwise”.Statistică aplicată în ştiinţele socio-umane Butonul „Options…” vă permite configurarea opţiunilor avansate referitoare la calculul coeficientului de corelaţie. Părăsirea ferestrei se face prin acţionarea butonului „Continue”. rezultatele analizei vor fi afişate în fereastra de rezultate (Output). respectiv produsului încrucişat al abaterilor (Cross-product deviations and covariances). SPSS va calcula totuşi coeficientul de corelaţie. ca măsură nestandardizată a relaţiei dintre cele două variabile – studiată la începutul acestui capitol – nu este altceva decât produsul încrucişat. 118 . Covarianţa. n-1). Acest indicator reprezintă. În acest fel se asigură obţinerea unui maximum de informaţii din datele introduse. Situaţia „Exclude cases listwise” exclude din analiză cazurile în care una dintre variabile nu are date. Secţiunea „Statistics” oferă posibilitatea calculului a două elemente: mediile şi abaterile standard pentru fiecare dintre variabilele analizate (Means and standard deviation) şi covarianţele. Dacă o variabilă conţine date iar cealaltă nu conţine date. însă este posibil să se piardă un volum important de informaţie. În general se utilizează prima opţiune. În câteva fracţiuni de secundă. Produsul încrucişat al abaterilor reprezintă suma produselor mediilor corectate ale variabilelor. SPSS nu va lua în calcul înregistrările în care lipsesc date din ambele vari abile. Secţiunea „Missing values” cuprinde două opţiuni reciproc exclusive şi se referă la tratarea cazurilor lipsă.

000003. Linia „Sig. în mod evident mai mică de 0.000 103 1. arată numărul de cazuri. coeficientul de corelaţie va fi 1. (2-tailed) N **. corelaţie semnificativă la un prag de semnificaţie mai mic de 0. deoarece pragul de semnificaţie este mai mic de 0. sunt afişate cele două variabile analizate („Nota examen” şi Emoţii examen”). valoare rotunjită.01. aspecte rezultate din semnul coeficientului de corelaţie şi din valoarea acestuia.000 Tabelul 1. corelând variabila cu ea însăşi. Pe noi ne interesează coeficientul de corelaţie dintre cele două variabile. Acesta este 0. Cercetarea a fost realizată pe un număr de 103 subiecţi. Atât pe linii. ultima linie. cât şi pe coloane.37 – Rezultatele corelaţiei bivariate r Bravais-Pearson Correlations Nota examen Pearson Correlation Nota examen Sig. În sfârşit. Correlation is significant at the 0. corelaţia este negativă şi moderată. 103.00.000 103 103. valoarea exactă este de 0. Ce concluzii putem extrage de aici? Desigur.01. Linia „Pearson Correlation” conţine valoarea coeficientului de corelaţie între cele două variabile. Mărimea Figura 1.000 Emotii examen -. (2-tailed) N Pearson Correlation Emotii examen Sig.441** . aşa cum rezultă şi din subsolul tabelului.441. În realitate.441** . Iată că am obţinut –0.20 – Diagrama de corelaţie între cele două variabile 119 .00.31 prezintă rezultatele acestei analize. Evident. (2-tailed)” exprimă în mod precis pragul de semnificaţie.000 -. avem de a face cu o corelaţie semnificativă. Totodată.01 level (2-tailed).Cristian Opariuc-Dan Tabelul 1.000 1.01. N.

20. precum şi intensitatea acesteia. Figura 1. în figura 1.22 – Alegerea tipului de diagramă de corelaţie 120 . ar fi posibilă existenţa unei alte variabile care să modereze această corelaţie (cred că ştiţi deja despre ce variabilă este vorba). aici. persoanele cu note slabe la examen. afirma că există o corelaţie moderată. Figura 1. Iată. două posibilităţi: fie utilizarea unui expert de creare a graficelor (opţiunea „Chart Builder…”. Se observă clar sensul n egativ al legăturii. sau 19. De asemenea. Pentru notele mari. prezintă şi un nivel semnificativ mai mare al emoţiilor. Puţină răbdare. Toate elementele grafice din SPSS se regăsesc în meniul „Graphs”. este posibil să nu existe nici un fel de legătură între cele două variabile (vedeţi grosimea norului de puncte în cele două cazuri. negativă şi semnificativă între performanţa la examen şi emoţiile din timpul examenului. putem suspecta o relaţie heteroscedastică. cu alte cuvinte să realizăm norul de puncte. vom avea în vedere a doua situaţie. Întrebarea pe care mi-o veţi pune acum va fi una referitoare la modul în care am ajuns la acest grafic. fie crearea manuală a acestora (opţiunea „Legacy Dialogs”). Există.Statistică aplicată în ştiinţele socio-umane efectului acestei relaţii este de 0. Pentru moment. Putem. aşadar. pentru a vedea dacă apar situaţii atipice. În acelaşi timp. urmând ca pe parcursul acestui volum să detaliem şi expertul în grafice SPSS.194. intensitatea efectului fiind una medie. diagrama de corelaţie. Corelaţia pare puternică doar în situaţia notelor mici obţinute la examen.21 – Crearea manuală a graficelor Nu ne-ar mai rămâne decât să facem o „poză” a acestei corelaţii.4% din varianţa unei variabile poate fi explicată prin cealaltă variabilă.

corelaţia dintre performanţa la examen şi emoţiile din timpul examenului (nor de puncte reprezentat prin cercuri) şi corelaţia dintre timpul de studiu şi performanţa la examen (nor de puncte reprezentat prin pătrate).24 – Grafic tip Matrix Scatter 121 . Varianta „Simple Scatter” este opţiunea care ne interesează pe noi. În acest caz. La intersecţia a două variabile se afişează norul de puncte corespunzător. am include în analiză şi timpul de studiu. Dacă.23 – Grafic tip Overlay Scatter cu două perechi de cată printr-un element de marcaj distinct. Pentru a nu desena mai multe grafice. Accesarea acestui meniu permite lansarea unei ferestre simple. se foloseşte în momentul în care avem de reprezentat mai mult de o pereche de variabile. permiţând afişarea. a mai multor perechi de variabile. de exemplu.Cristian Opariuc-Dan Graficul care ne interesează este „Scatter/Dot…”. în acest formular. Pe ambele axe sunt incluse variabilele. intenţionăm să reprezentăm pe acelaşi grafic. reprezentarea tuturor celor trei diagrame de corelaţie. pe aceeaşi diagramă. Există. de selecţie a tipului de grafic. Vom variabile folosi acest grafic dacă. aşa cum se poate observa în figura 1. în figura 1. un număr de 5 variante de grafice.24. A treia formă. fiecare variabilă fiind indiFigura 1. permiţând eventual intervenţia unei a treia variabila categoriale (de exemplu sexul). SPSS ar efectua un număr de 3 corelaţii. se poate folosi această formă. de exemplu. Observăm. graficul va desena cele două variabile pe ordonată şi abscisă.22. „Matrix Scatter”. corespunzătoare perechilor de variabile. „Overlay Scatter” este o versiune a graficului simplu. Puteţi Figura 1.

Statistică aplicată în ştiinţele socio-umane

remarca, pe al doilea rând, ultimul cadran, graficul din figura 1.20. Aceasta este o modalitate ideală de a vizualiza ansamblul legăturilor dintre variabile. Graficul „3-D Scatter” este util în reprezentarea tridimensională a corelaţiilor între mai multe perechi de variabile. Este o diagramă de corelaţie mai dificil de analizat şi presupune o oarecare experienţă în analiza datelor, folosindu-se frecvent în analiza factorială şi în corelaţii parţiale. În figura Figura 1.25 – Grafic tip 31.25, reprezentând tridimensional cele trei variabile, D Scatter putem observa uşor lipsa efectului emoţiilor din timpul examenului. Norul de puncte este concentrat preponderent în zona variabilelor „nota examen” şi „timp de studiu”, cu orientare către scoruri mici ale dimensiunii „emoţiei din timpul examenelor”. Graficul de tip „Simple dot” nu-l vom discuta. Acesta nu reprezintă un nor de puncte propriu-zis ci o variantă a graficului cu bare, prin care reprezentăm observaţiile individuale ale unei singure variabile. Acum să trecem la treabă. Am ales norul de puncte simplu, am apăsat butonul „Define” pentru a intra în modul de definiţie al graficului, acum privim la noua fereastră care ne ocupă ecranul.

Figura 1.26 – Formularul de definire a graficului de tip „nor de puncte”

122

Cristian Opariuc-Dan În partea stângă, avem, de acum obişnuita listă a variabilelor din baza de date. În partea dreaptă regăsim butoanele de transfer, corespunzătoare se cţiunilor care trebuie definite. Secţiunea „Y-Axis” permite includerea variabilei ce va fi reprezentată pe abscisă (axa OY). În cazul nostru, am inclus emoţiile din timpul examenului. „X-Axis” va conţine variabila reprezentată pe ordonată (axa OX). Nota obţinută la examen a fost selectată în vederea reprezentării pe această axă. Caseta „Set Markers by” se foloseşte în cazul în care dorim să includem o variabilă categorială, ce va diferenţia datele. De exemplu, dacă dorim să reprezentăm diferit norul de puncte al bărbaţilor în comparaţie cu cel al femeilor, vom include variabila „Gen biologic” în această secţiune. Graficul va reprezenta datele femeilor cu cercuri şi datele bărbaţilor cu pătrare. Secţiunea „Label cases by” reprezintă un alt element deosebit de util în condiţiile în care dorim să identificăm fiecare element din grafic. De exemplu, dacă am include genul biologic în această casetă, deasupra fiecărui cerc de pe grafic, se va afişa genul biologic al subiectului respectiv. Desigur, dacă am dori să reprezentăm datele separat pentru bărbaţi şi pentru femei, vom prefera varianta „Set Markers by”, deoarece „Label Cases by” poate duce la o supra-aglomerare a graficului. Alternativ, am putea include în această casetă, variabila „timp de studiu”. Într-o asemenea situaţie, deasupra fiecărui cerc de pe grafic, va fi afişată valoarea timpului petrecut de către fiecare subiect în vederea pregătirii pentru examen. Secţiunea „Panel by” permite separarea graficului în funcţie de o variabilă categorială. Dacă dorim să afişăm separat norul de puncte pentru bărbaţi şi pentru femei, putem include în această secţiune variabila „gen biol ogic”. În funcţie de dorinţă, graficul va fi separat pe orizontală dacă variabila se include în caseta „Rows” sau pe verticală dacă o includem în caseta „Columns”. Secţiunea „Template” permite încărcarea unui şablon grafic dintr-un fişier. Colecţii de şabloane grafice pentru SPSS pot fi găsite pe Internet, în galeria aplicaţiei sau pot fi comandate la compania producătoare. 123

Statistică aplicată în ştiinţele socio-umane

Butonul „Titles…” este destinat denumirii graficului. Putem include două linii de text în antetul graficului (partea superioară) şi două linii de text în subsolul graficului (partea inferioară). Opţiunea se foloseşte pentru denumirea graficului şi pentru eventualele explicaţii suplimentare referitoare la semnificaţia acestuia, ori la drepturile de autor. Nu mai intrăm în detalii referitoare la butonul „Options…” deoarece nu cred că v-ar putea interesa în mod deosebit. Oricum, acest buton are câteva variante de configurare avansată, de natură grafică şi statistică. Dacă doriţi să aflaţi mai multe, consultaţi excelentul sistem de asistenţă al programului SPSS, prin apăsarea butonului „Help”. Sistemul de asistenţă este furnizat în limba engleză şi reprezintă o adevărată enciclopedie statistică. Finalizarea definirii graficului şi lansarea opţiunii de desenare se poate face prin apăsarea butonului OK. În câteva momente, în fereastra de rezultate, veţi obţine desenul solicitat. Excelent! În acest moment, avem toate datele necesare elaborării unui raport, privind studiul acestei corelaţii. Mai jos, veţi găsi o analiză completă a studiului propus. Vă voi ruga să comparaţi cele expuse cu activităţile du mneavoastră de cercetare. Dacă consideraţi că studiile dumneavoastră sunt mai complexe, vă rog să-mi scrieţi. Dacă nu, vă rog ca de acum înainte să abordaţi cel puţin acest nivel. Studiul efectuat pe un lot de cercetare de 103 studenţi, în baza ipotezei nedirecţionale conform căreia există o legătură semnificativă între performanţa studenţilor la examen şi emoţiile acestora în timpul examenului, s-a bazat pe un plan corelaţional. Cele două variabile („Nota examen” şi „Emoţii examen”) se situează la un nivel de măsură scalar, analiza distribuţiei acestora permiţând utilizarea statisticilor parame-

124

în condiţiile unei lucrări destinate însuşirii tehnicilor de analiză a datelor. Într-o primă etapă. Pentru studenţii cu note mari. Având la dispoziţie aceste date. Totuşi. rezultând o valoare a corelaţiei de r=-0. a fost folosit coeficientul de corelaţie r Bravais -Pearson. Nici nu este cazul. nu m-aş hazarda să fac aprecieri asupra acestor fapte. În mod cert.01.4%. la fel şi 125 . se datorează. Interpretarea statistică nu se poate confunda cu un alt tip de interpretare. emoţiilor din timpul examenului.194. Iată cam cum puteţi prezenta rezultatele unui studiu de acest tip. la un prag de semnificaţie p<0. În consecinţă. planul de cercetare este incomplet şi urmează a fi optimizat. Mărimea efectului acestei corelaţii este de 0. putem respinge ipoteza nulă. Putem considera că. studiind diagrama de corelaţie. corespunzătoare scorurilor mari la emoţii în timpul examenului. se remarcă imediat existenţa unei legături heteroscedastice. un sociolog îşi poate exprima punctul de vedere. un psiholog poate avea viziune proprie. Stati stica se bazează pe datele existente şi oferă un raport constatativ şi nu explicativ a fenomenelor. ori existenţa unui optim emoţional până la care această atitudine poate corela cu o contraperformanţă. lipsa de performanţă în condiţii de examen.Cristian Opariuc-Dan trice. Aţi observat că nu m-am hazardat să ofer vreo explicaţie psihologică.4%. în procent de 19.441. În mod cert vor exista diferenţe între ceea ce ştiaţi până acum şi ceea ce aţi găsit mai sus. Astfel. negativă şi semnificativă între cele două variabile. cât şi emoţiile din timpul examenului. sociologică sau economică a faptelor constatate. în situaţii de evaluare. studenţii cu note mici la examen sunt caracterizaţi prin niveluri ridicate ale emoţiilor în timpul examenului. Asocierea negativă între cele două variabile pare a exista doar în cazul notelor mici la examen. care să influenţeze atât performanţa la examen. pot fi consideraţi ca fiind puţin emotivi. Se poate suspecta existenţa unei variabile moderatoare. corespunzătoare unei varianţe explicate de 19. Deşi sunt psiholog de profesie. relaţia nu se mai respectă. şi putem afirma că există o corelaţie medie. Cei care obţin performanţe la acest examen.

Fereastra se aseamănă foarte mult cu cea întâlnită la corelaţiile bivariate.28. Automat. ne gândim la timpul de studiu. Reţineţi că metodele de analiză a dat elor oferă fapte. Singura diferenţă constă în locaţia de includere a variabilelor spre analiză. în condiţiile controlului asupra variabilei „tipul alocat studiului”. precum şi între emoţiile din timpul examenului şi timpul alocat studiului. Interpretarea faptelor cade în sarcina analistului.27 –Lansarea corelaţiilor parţiale te.28 –Configurarea corelaţiilor parţiale 126 . precizaţi tipul acestora. elaboraţi raportul. Stabiliţi ipotezele. nu mai apelăm opţiunea „Bivariate…” ci vom folosi „Partial…”. În acest caz. vom avea în vedere o corelaţie parţială. Formularul este asemănător cu cel de la corelaţiile bivariate. Analiza noastră urmăreşte corelarea notei obţinute la examen cu emoţiile din timpul examenului. care să modereze atât performanţa la examen. astfel încât fereastra dumneavoastră va trebui să arate ca în figura 1.Statistică aplicată în ştiinţele socio-umane un economist sau un medic psihiatru. Meniul din care putem lansa calculul corelaţiilor parţiale îl regăsim în aceeaşi locaţie. Singura diferenţă constă în dispariţia Figura 1. Presupunând existenţa unei a treia variabile. analizaţi cifric şi grafic coeficienţii de corelaţiei. De data aceasta. Butonul „Options” va deschide o altă fereastră. de configurare a opţiunilor avansate. cât şi emoţiile din timpul examenului. lista „Variables” conţine variabilele ce urmează a fi corelaFigura 1. iar lista „Controlling for” se referă la variabilele de control. Exerciţii: Studiaţi legătura care există între performanţa la examen şi timpul alocat studiului.

000 101 1.000 .397 . a cărei selectare comunică programului calcularea corelaţiilor r Bravais-Pearson. fără moderare. Apăsarea butonului „Continue” închide această fereastră şi se revine în primul formu- Figura 1. în fereastra de rezultate. între perechile formate din cele trei variabile.000 101 1.012 100 -.247 . Tabelul 1. 0 -.Cristian Opariuc-Dan produsului încrucişat al abaterilor şi apariţia casetei de bifare „Zero-order correlations”. În scurt timp veţi obţine. Facilitatea este foarte utilă. 0 .000 101 -.000 101 1.397 .247 .012 100 1.29 –Opţiuni avansate de configurare lar.000 . După ce am introdus cu atenţie variabile care urmează a fi calculate.36.709 . Nota examen Emotii examen Timp de studiu 1.000 101 -.000 101 . prin urmare am bifat-o şi noi. putem lansa operaţiunea prin apăsarea butonului OK. 0 -. 0 127 .000 .709 . tabelul 1. 0 -. Cells contain zero-order (Pearson) correlations.000 .38 – Rezultatele corelaţiei parţiale Correlations Control Variables -none-a Nota examen Correlation Significance (2-tailed) Df Emotii examen Correlation Significance (2-tailed) Df Timp de studiu Correlation Significance (2-tailed) Df Timp de studiu Nota examen Correlation Significance (2-tailed) Df Emotii examen Correlation Significance (2-tailed) Df a.000 .441 .441 . scutindu-ne de a efectua corelaţii repetate.

p<0. Se remarcă foarte uşor intensitatea slabă a corelaţiei dintre nota obţinută şi emoţiile din timpul examenului. la un număr de 100 de grade de libertate. În partea de sus. corelaţia este semnificativă şi poz itivă. între notele obţinute la examen şi emoţiile din timpul exam enului. precum şi traseul descendent al norului de puncte.01. există o corelaţie parţială negativă şi semnificativă r12. Figura 1.01. realizând astfel o importantă economie de timp. sunt afişate cele trei variabile analizate şi corelaţiile de rang zero între ele. în condiţiile în care controlăm efectul timpului alocat pentru studiu.397. p<0. Reprezentarea grafică adecvată acestei corelaţii este graficul tridimensional „3-D Scatter”. Ştim deja.3=-0. p<0.Statistică aplicată în ştiinţele socio-umane Vi se pare un tabel complicat? Nu este cazul să vă speriaţi. r=0. similar. luate două câte două. adică doar 6% din varianţa notei obţinute la examen poate fi regăsită în emoţiile din timpul examenului. În partea de jos a tabelului.247.06. În loc să efectuăm trei corelaţii bivariate.05. Între nota la examen şi timpul alocat studiului. Aţi observat că aceste corelaţii de ordin zero nu reprezintă altceva decât coeficienţii de corelaţie r Bravais-Pearson între cele trei variabile. Pe axele OX şi OY se reprezintă cele două variabile corelate.01. iar pe axa OZ vom afişa variabila de control. regăsim corelaţia parţială solicitată. în condiţiile controlului exercitat de timpul de studiu. Observăm că între nota obţinută de către studenţi la examen şi emoţiile din ti mpul examenului.709. r=-0. între timpul de studiu şi emoţiile din timpul examenului există o corelaţie negativă. p<0. Efectul acestei corelaţii este de 0.441. bifăm caseta „Zero-order correlations” iar SPSS le va calcula automat.30 – Graficul corelaţiei parţiale 128 . avem un coeficient de corelaţie semnificativ de r=-0.

085 . coeficientul de corelaţie punct biserial nu este altceva decât coeficientul de corelaţie r Bravais-Pearson. 2002) recomandă codarea variabilei dihotomice cu valorile zero şi unu pentru a nu exista nici un fel de dubiu referitor la calculul acestui coeficient. În SPSS. (Swinscow.00 .00 1.391 103 1. la care se adaugă elemente ce ţin de variabila de control. de relaţia existentă între genul biologic şi timpul alocat studiului. Suntem în situaţia asocierii unei variabile dihotomice cu o dihotomie discretă. (2-tailed) N 103. În realitate. Ce tip de corelaţie folosim? Aţi ghicit.Cristian Opariuc-Dan Interpretarea corelaţiei parţiale se realizează similar corelaţiei bivari ate simple. Calculaţi coeficientul de corelaţie r Bravais-Pearson între genul biologic şi timpul de studiu. 2000). Unii autori (Field. și alții. (2-tailed) N Pearson Correlation Timp de studiu Sig. (Bakeman. reală. și alții. SPSS realizează automat conversia. În cazul nostru. cu o variabilă continuă.391 103 103. S-ar putea să fim interesaţi.085 . în condiţiile în care una dintre variabile este dihotomică. 2004). puteţi observa lipsa oricărei asocieri între cele două variabile. 129 . variabila „gen biologic” este o variabilă dihotomică codată cu unu şi doi.00 Timp de studiu . iar calculul coeficientului de corelaţie punct biserial nu pune probleme. corelaţie punct biserială.39 – Rezultatele corelaţiei punct biseriale Correlations Gen biologic Pearson Correlation Gen biologic Sig. la un moment dat. Putem afirma că cele două variabile sunt independente. Tabelul 1.00 În tabelul de mai sus. genul biologic nu determină nici un efect asupra timpului de studiu. pentru a vedea în ce măsură sexul subiecţilor determină efecte asupra timpului de studiu.

În cazul în care variabila dihotomică are o dihotomie continuă şi se impune calculul acestui coeficient. Cunoscând toate aceste elemente. I. utilizând SPSS.Statistică aplicată în ştiinţele socio-umane SPSS nu dispune de proceduri distincte de calcul a coeficientului de corelaţie biserial.2 Coeficienţi de corelaţie bazaţi pe date neparametrice Tabelul 1. Etichetele variabilelor neparametrice sunt prezentate în tabelul 1. efectuată la nivelul unei unităţi militare.5. puteţi calcula întâi coeficientul de corelaţie punct biserial şi apoi puteţi aplica formula de transformare în coeficient biserial.40 – Structura bazei de date Variabila sex educatie grad inaltime greutate Eticheta Genul biologic Ultima scoala Grad militar Inaltimea Greutatea Nivel de măsură Nominal Nominal Ordinal Ordinal Scale Scale Tip Numeric Numeric Numeric Numeric Numeric Numeric Caractere 1 1 1 1 3 3 culoare_ochi Culoarea ochilor Pentru a studia. Tabelul 1. cercetare în care ne interesează să înregistrăm variabilele prezente în tabelul 1. baza de date creată mai sus nu ne este de prea mare ajutor. Se observă existenţa unui număr de 2 variabile de nivel nominal. aşa cum s-a arătat în capitolul dedicat acestor coeficienţi.41 – Valorile variabilelor Valoare Sex 1 2 culoare_ochi 1 2 3 4 Educatie 1 2 3 4 Grad 1 2 3 4 Etichetă Masculin Feminin Albastri Verzi Caprui Negri Liceul Scoala postliceala Facultate Postuniversitare Subofiter Ofiter cu grad inferior Ofiter cu grad superior General Această bază de date corespunde unei cercetări imaginare. Vom realiza o nouă bază de date. legătura dintre variabilele situate la un nivel de măsură neparametric. nu vă rămâne decât să proiectaţi baza de date şi 130 . două variabile ordinale şi două variabile scalare. şi nu necesită explicaţii. având o structură diferită.41.40. structură suficientă îndeplinirii scopurilor noastre.

sub acelaşi nume. pentru a evita surprizele provocate de o eventuală blocare a computerului. „Corelaţii neparametrice.sav”. la final.42 aveţi structura completă a acestor informaţii.Cristian Opariuc-Dan să o salvaţi sub un nume. În tabelul 1. Tabelul 1. cu multă răbdare şi completaţi cele 50 de cazuri. Desigur. După salvare. nu veţi uita să salvaţi din nou baza de date.42 – Baza de date pentru corelaţii neparametrice Sex 1 2 2 2 1 1 1 1 2 1 1 1 1 2 1 1 1 2 1 1 2 Culoare 3 2 1 3 1 3 4 3 1 1 3 3 4 4 1 3 4 4 3 4 3 Educatie 4 4 4 4 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 Grad 4 4 3 3 3 3 4 4 4 3 3 3 3 3 3 3 3 3 3 3 2 Inaltime 172 180 184 176 173 187 178 180 170 171 172 170 185 172 187 193 184 175 187 169 171 Greutate 87 102 79 86 85 77 80 100 82 71 79 89 90 94 75 73 83 80 84 71 93 Sex 2 1 1 1 2 2 1 1 1 2 2 1 1 2 2 1 1 2 1 1 1 Culoare 3 1 4 4 2 2 2 3 4 3 1 1 4 4 3 3 3 3 3 2 2 Educatie 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Grad 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 Inaltime 193 175 177 170 188 172 170 173 171 186 187 191 178 181 187 174 189 170 182 186 193 Greutate 94 96 92 69 81 76 93 98 74 77 92 99 72 85 72 100 86 77 90 90 97 131 . următorul pas este reprezentat de popularea bazei de date. Îna rmaţi-vă. pentru a putea demara apoi analiza. să spunem. aşadar. Desigur. toate valorile sunt fictive şi nu corespund unei cercetări reale.

Statistică aplicată în ştiinţele socio-umane 1 1 1 1 2 2 3 3 3 3 3 3 2 2 2 2 188 174 174 184 69 74 78 91 1 2 1 1 3 3 3 3 2 1 1 1 1 1 1 2 177 182 188 172 70 82 87 97 Pentru început. că înălţimea subiecţilor nu are o distribuţie normală. Următoarea alternativă este aceea a coeficienţilor de corelaţie ρ Spearman şi τ Kendall. opţiunea „Bivariate…”. la calculul coeficientului de corelaţie r Bravais-Pearson. Să presupunem. apoi submeniul „Correlate” şi. Nu vom mai bifa caseta „Pearson” din cadrul secţiunii „Correlation Coefficients”. putându-se folosi coeficientul de corelaţie r BravaisPearson. Teoretic. Veţi accesa meniul „Analyze”. ne propunem să analizăm relaţia dintre înălţimea şi greutatea celor 50 de subiecţi. şi. Media nu mai este un indicator reprezentativ pentru tendinţa centrală. Pentru a începe calculul acestor doi coeficienţi. prin urmare. în final. cu o singură excepţie. nu vom putea folosi coeficientul de corelaţie menţionat mai sus. Se va deschide cunoscuta fereastră din figura 1. apoi aţi bifat caseta „Pearson”. În cazul nostru. aţi inclus cele două variabile în lista variabilelor supuse analizei. Atunci când aţi calculat coeficientul de corelaţie r Bravais-Pearson.32 – Fereastra de analiză a corelaţiilor . arătând faptul că tendinţa în gruFigura 1. veţi proceda exact la fel ca mai sus. lucrurile stau la fel.32.31 – Meniul de lansare a analizei pul de studiu este către subiecţii înalţi. ci casetele „Kendall’s tau-b” pentru a calcula coeficientul de corelaţie τ Kendall şi „Spearman” pen132 Figura 1. ambele variabile sunt de tip scalar. ci una puternic asimetrică la stânga. vă amintiţi. însă.

Situaţia noastră ar trebui să bucure sau să supere cercetătorul.Cristian Opariuc-Dan tru a calcula coeficientul de corelaţie ρ Spearman.41. 50 1.000 133 .069 . La fel ca în cazul coeficientului de corelaţie r Pearson. toate aspectele fiind lămurite anterior. dacă am specificat acest lucru în fereastra de configurare a analizei) şi numărul de subiecţi investigaţi (n).491 50 1.097 . (2-tailed) N Greutatea Correlation Coefficient Sig.097) între înălţimea şi greutatea subiecţilor. vă reamintim.097 . coeficienţi de corelaţie ai rangurilor.000 1.069 . Alte explicaţii. ρ=0. la acest nivel. nu sunt necesare. 50 . tabelul conţine trei elemente: valoarea coeficientului de corelaţie.503 . bazate pe coeficientul de corelaţie τ Kendall şi pe coeficientul de corelaţie ρ Spearman.069. Nu rămâne decât să apăsaţi butonul „OK” pentru ca programul să iniţieze calculul acestor date.000 Greutatea . în care sunt prezentate cele două analize. . (2-tailed) N Greutatea Correlation Coefficient Sig.491 .503 50 1. ambii fiind. pragul de semnificaţie pentru o ipoteză bilaterală (sau unilaterală. în funcţie de modul în care şi-a formulat obiectivele. foarte mici (τ=0. 50 .000 50 . Tabelul 1.43 – Rezultatul analizei legăturii dintre înălţime şi greutate Correlations Înălţimea Kendall's tau_b Înălţimea Correlation Coefficient Sig. (2-tailed) N Spearman's rho Înălţimea Correlation Coefficient Sig. (2-tailed) . Se poate observa existenţa unor coeficienţi de corelaţie nesemnificativi. la fel cu tabelul 1. Fereastra de rezultate va afişa un tabel.

o tendinţă către un tip de corelaţie pozitivă.43 – Rezultatul analizei legăturii dintre înălţime şi greutate Correlations Înălţimea Kendall's tau_b Înălţimea Correlation Coefficient Sig.Statistică aplicată în ştiinţele socio-umane Tabelul 1. în care am reprezentat grafic această relaţie.097 .069 . Înalţi-Slabi 134 . (2-tailed) N Spearman's rho Înălţimea Correlation Coefficient Sig. 50 . presupunând că am fi lucrat cu date reale.000 1.491 . cele două variabile fiind independente.503 . (2-tailed) N Greutatea Correlation Coefficient Sig. 50 1.503 50 1.069 . putem observa câteva lucruri interesante.097 .000 Greutatea .000 În concordanţă cu datele cercetării. într-adevăr.33 – Relaţia dintre înălţime şi greutate şi supraponderale. 50 50 .491 50 1. Lipsa unui coeficient de corelaţie semnificativ se poate datora tocmai acestui lucru şi. tendinţă anulată însă de două situaţii particulare: de existenţa unui grup de persoane foarte Scunzi-Graşi înalte şi foarte slabe şi de existenţa unui alt grup de persoane – ceva mai numeros – scunde Figura 1. Privind figura 1. (2-tailed) N Greutatea Correlation Coefficient Sig.33. O asemenea cercetare. 50 . Există. iar noi putem să nu respingem ipoteza nulă. nu există nicio legătură între înălţimea şi greutatea subiecţilor.000 50 . putem suspecta. poate fi lipsită de valoare? Depinde de modul în care explicăm rezultatele. (2-tailed) N .

Analiza coeficientului de corelaţie τ Kendall ori a coeficientului de corelaţie ρ Spearman se realizează la fel ca şi cea a coeficientului de corelaţie r Bravais-Pearson. drept pentru care nu vom intra în amănunte referitoare la acest lucru. construcţia şi analiza tabelelor de contingenţă se află în cadrul meniului „Analyze” la „Descriptive Statistics” şi apoi opţiunea „Crosstabs…”. alături de butoanele-săgeată de transfer. Fiind un element nou.Cristian Opariuc-Dan influenţa unei variabile de grup – probabil tipul constituţional – pe care nu am luat-o în considerare. Cum vom proceda în condiţiile în care dorim să aflăm dacă există vreo legătură între genul biologic al subiecţilor şi culoarea ochilor? Ambele Figura 1. ne vom concentra atenţia asupra formularului. de reiniţializare a formularului „Reset”. de fapt chiar ideea conceptului menţionat mai sus. La accesarea acestei opţiuni.35 – Fereastra de configurare şi analiză a tabelelor de contingenţă nul de lansare a analizei „OK”. cea de tabel de contingenţă. Termenul semnifică ideea de „tabele încrucişate”. Se observă câteva elemente comune: lista variabilelor din baza de date.34 – Meniul de accesare a tabelelor de contingenţă. 135 . se va deschide o fereastră nouă. variabile sunt la un nivel de măsură nominal. În SPSS for Windows. buto.Figura 1. de anulare „Cancel” şi de asistenţă „Help”. fereastra de configurare şi de analiză a tabelului de contingenţă. de copiere a codului „Paste”. iar singura posibilitate pe care o avem este aceea de a utiliza tabelele de contingenţă.

o analiză a relaţiei dintre culo area ochilor şi culoarea părului pentru bărbaţi şi o altă analiză. în vederea construcţiei unor tabele multidimensionale. Dacă bifaţi caseta „Display clustered bar charts”. În cazul nostru. Butoanele „Previous” şi „Next” permit navigarea prin modelele de variabile de control. aşadar. succesivă. cât şi a celor multidimensionale. în vederea adăugării sau în vederea modificării acestora. în marea lor majoritate. SPSS ne permite construcţia de modele ierarhice folosind variabile de control. aceasta funcţionând ca variabilă de control. comunicaţi programului SPSS să construiască un grafic cu bare. Vom obţine. atunci am include variabila „gen biologic” în lista „Layer”. controale noi. programul efectuează analize separate pentru fiecare categorie a fiecărei variab ile de control introduse. respectiv pe coloanele tabelului de contingenţă. Listele „Row(s):” şi „Column(s):” se referă la variabilele ce vor fi reprezentate pe liniile. grupat după o variabilă. SPSS permite atât analiza tabelelor de contingenţă bidimensionale. pentru a vedea efectul exercitat de introducerea. fiecare grup conţinând categoriile celeilalte variabile. 136 .Statistică aplicată în ştiinţele socio-umane Celelalte elemente sunt. Secţiunea „Layer” vizează includerea în analiză a uneia sau a mai multor variabile de control. Rezultă că. SPSS ar construi două grupuri de grafice cu bare – pentru femei şi pentru bărbaţi – fiecare grup conţinând graficul cu bare pentru culoarea ochilor. variabile care presupunem că ar putea influenţa tabelul de contingenţă. La includerea uneia sau a mai multor variabile în această listă. a acestora. De exemplu. astfel încât le vom trata în detaliu. dacă am studia relaţia dintre „culoarea ochilor” şi „culoarea părului” şi am presupune că această relaţie este influenţată de „genul biologic”. separată. putem include mai multe variabile în listele „Row(s)” ori „Column(s)”. Mai mult. pentru femei.

metoda clasică de calcul a semtestelor de semnificaţie nificaţiei. derivată din calculul repetat. se vor folosi în condiţiile în care distribuţia datelor nu permite utilizarea metodei clasice.36 – Configurarea Este. Figura 1. aşa cum a fost ea descrisă până acum. Apăsarea butonului „Exact…” determină deschiderea formularului de configurare a testelor de semnificaţie. furnizând o serie de metode adiţionale. Pentru un număr redus de cazuri sau în condiţiile în care omogenitatea distribuţiei pune probleme. Se poate folosi în cazul 137 . deoarece rezultatele pot să piardă foarte mult din lizibilitate. „Monte Carlo” şi „Exact”. dacă doriţi. chiar în condiţiile în care nu se poate aplica metoda clasică. în acest volum. efectuat pe mai multe eşantioane de tabele de contingenţă de aceleaşi dimensiuni. Personal nu recomand bifarea acestei opţiuni.Cristian Opariuc-Dan Bifarea casetei ”Suppress tables” are ca efect includerea tuturor tabelelor de contingenţă într-unul singur (dezactivându-se şi butoanele „Cells…” şi „Format…”). şi cu aceleaşi totaluri marginale ca şi tabelul analizat. varianta pleacă de la premisa că setul de date este suficient de mare şi uniform distribuit. Varianta „Asymptotic only” este metoda implicită. asimptotică. nu şi asupra procedurilor de calcul. Caseta are efect numai asupra modului de prezentare al datelor. Totuşi. bazată pe simulare. O valoare este considerată semnificativă dacă pragul de se mnificaţie este mai mic de 0. Metoda „Monte Carlo” permite estimarea precisă a pragului de semnificaţie. bazată pe calculul nivelului de semnificaţie în funcţie de tipul distribuţiei teoretice. Metoda „Monte Carlo” reprezintă o formă precisă de analiză a nivelului de semnificaţie. această metodă poate să nu reprezinte un bun indicator al pragului de semnificaţie.05. Celelalte metode.

grupat pe secţiuni. se referă la nivelul de încredere („Confidence level”).05 sau 99% pentru un prag de semnificaţie de 0. Deoarece este o operaţiune de durată. însă consumă foarte mult din puterea de calcul a procesorului. suficient. Singurele elemente care trebuie configurate. este suficientă. Să nu spuneţi că nu v-am avertizat! Apăsarea butonului „Continue” permite revenirea în formularul iniţial. Butonul „Statistics…” ne interesează în mod deosebit. O valoarea mai mare determină şi un nivel de precizie mai mare. nu prea avem motive să folosim altă metodă decât cea clasică.Statistică aplicată în ştiinţele socio-umane în care numărul subiecţilor este suficient de mare. puteţi folosi metoda „Monte Carlo”.000. Utilizarea metodei „Exact” presupune un computer foarte puternic şi multă răbdare.05 este considerat. Metoda „Exact” permite calcularea precisă a probabilităţii de apariţie a unui răspuns. puteţi comunica programului să nu execute teste care depăşesc durata menţionată. deoarece din această fereastră putem alege indicatorii care ne interesează. conţine doar 138 Figura 1. asimptotică. Valoarea implicită. 10. În general. care poate fi 95% pentru un prag de semnificaţie de 0. un nivel de semnificaţie mai mic de 0. indicând existenţa unei relaţii între variabile.37 – Configurarea coeficienţilor de corelaţie . poate fi configurată limita de timp per fiecare test. şi aici. Formularul este foarte intuitiv. Bifând caseta „Time limit per test”. analiza fiind de lungă durată. însă avem de a face cu o distribuţie problematică. cu memorarea testului de semnificaţie dorit. Uneori s-ar putea să aveţi surpriza că vă îngheaţă calculatorul şi singura variantă va fi să-l scoateţi din priză.01 şi numărul de eşantioane pe baza cărora se va face simularea („Number of samples”). Dacă totuşi doriţi să fiţi extrem de precişi. În mod normal.

Caseta „Correlations” o puteţi folosi în condiţiile în care tabelul de contingenţă conţine date aflate la un nivel ordinal sau scalar. coeficientul de contingenţă probabilistic-proporţională χ2. acela care permite realizarea unui fel de predicţii şi caseta „Uncertainty coefficient”. Secţiunea „Nominal” se referă la coeficienţi de asociere pentru date nominale. Dacă cele două variabile nu sunt nominale sau ordinale. pentru a calcula coeficientul de contingenţă Pearson χ2. Pentru tabele bidimensionale cu mai multe linii şi coloane. reperul este χ2 Pearson sau χ2 probabilistic proporţional. În esenţă. cel mai bun indicator va fi coeficientul de asociere liniară χ2.Cristian Opariuc-Dan casete de bifare. χ2 corectat pentru continuitate se foloseşte strict pentru tabele de continuitate bidimensionale de tip 2x2. Puteţi bifa caseta „Contingency coefficient” pentru a calcula coeficientul de contingenţă. Bifaţi această casetă. caseta „Lambda” pentru coeficientul de asociere λ. Caseta „Chi-square” se referă exact la coeficientul de contingenţă χ2. Haideţi să-i luăm pe fiecare în parte. Ştiu că nu aţi auzit de aceşti coeficienţi. Goodman şi Kruskal. Testul de semnificaţie Fisher se foloseşte doar pentru tabele 2x2. ci se situează la un nivel scalar. cel puţin un motiv pentru care este important să definim corect nivelul de măsură atunci când proiectăm baza de date. Iată. Se va calcula coeficientul de corelaţie ρ Spearman. caseta „Phi and Cramer’s V” pentru a calcula coeficienţii de contingenţă φ Pearson şi v Cramer. Spre exemplu. Nu vă impacientaţi. Remarcaţi o serie de indicatori pe care-i cunoaşteţi. cu ajutorul căreia 139 . sunt forme derivate din χ2. dacă datele se află la un nivel ordinal sau/şi coeficientul de corelaţie r Pearson dacă datele se află la un nivel scalar. în cazul în care frecvenţa aşteptată la nivelul unei celule este mai mică de 5. pentru a răspunde unor necesităţi specifice de cercetare. dar şi indicatori de care probabil nu aţi auzit. testul de semnificaţie Fisher şi coeficientul de contingenţă Yate χ2 corectat pentru continuitate. aşa cum am văzut deja. Toate aceste elemente le vom discuta în momentul în care vom analiza rezultatele.

Măsoară. un coeficient asemănător coeficientului de concordanţă W Kendall. plătită. reducerea proporţională a erorilor atunci când o variabilă este folosită pentru a prezice o altă variabilă. Bifarea casetei „Gamma” permite calculul coeficientului de corelaţie γ. Caseta „Somer’s d” oferă posibilitatea calculului coeficientului de corelaţie d Somers.Statistică aplicată în ştiinţele socio-umane calculaţi coeficientul de incertitudine. de asemenea. deşi include această procedură în anumite teste st atistice. astfel: Caseta „Kappa” ne oferă o măsură a acordului. programatorii de la SPSS Inc. calculează coeficientul Cohen κ. Coeficientul este unul nedirecţional. Oricum. În „imensa lor generozitate”. Secţiunea „Ordinal” permite calculul coeficienţilor de corelaţie în situaţia în care variabilele se află la un nivel ordinal. Singura diferenţă dintre cei doi coeficienţi este aceea că τb ţine seama de rangurile egale iar τc nu ţine seama de aceste ranguri. Singurul coeficient pus la dispoziţie de SPSS este coeficientul η (eta). Casetele „Kendall’s tau-b” şi „Kendall’s tau-c” permit calculul variantelor b şi c ale coeficientului de corelaţie al rangurilor τ Kendall. coeficientul κ Cohen se poate folosi ca o alternativă la coef icientul W Kendall. 140 . în situaţia în care ambele variabile au acelaşi număr de categorii şi aceleaşi valori ale categoriilor. desigur. Acesta din urmă nu a fost studiat. Acest indicator nu a fost studiat. pe care nu l-am analizat în detaliu în această lucrare. pe care l-am studiat. ia valori între 0 şi 1 şi exprimă intensitatea legăturii dintre o variabilă nominală şi una ordinală sau scalară. însă seamănă mult cu coeficientul λ Goodman şi Kruskal. însă se foloseşte ca şi coeficientul ce corelaţie ρ Spearman sau τ Kendall Secţiunea „Nominal by Interval” se referă la cazul în care o variabilă se află la un nivel de măsură de interval iar o altă variabilă este nominală. De fapt. SPSS nu oferă o modalitate directă de calcul a coeficientului de concordanţă W Kendall. cu bani grei. ne oferă o serie de indicatori suplimentari.

Secţiunea „Percentages” permite adăugarea şi a frecvenţelor relative (procente) pentru variabilele situate pe linii („Row”). şi/sau pentru variabilele situate pe coloane („Column”) ori la nivelul rezultatelor marginale („Total”). motiv pentru care îl vom discuta cu altă ocazie. Ele permit afişarea. a frecvenţelor actuale (observate) şi/sau a frecvenţelor estimate (teoretice). acesta este coeficientul care vi se potriveşte cel mai bine. în condiţiile în care se lucrează cu χ2. Coeficientul „McNemar” studiază legătura dintre două variabile dihotomice şi se bazează tot pe χ2. Se foloseşte. nestandar- 141 .Cristian Opariuc-Dan Caseta „Risk” nu se referă la riscul de a vă pierde buna dispoziţie citind această carte. Controlul afişării acestor elemente se realizează prin intermediul secţiunii „Residuals”. în tabelul de contingenţă. Dacă doriţi să studiaţi relaţia dintre prezenţa soacrei şi apariţia unui conflict în familie. referindu-se mai mult la studiul diferenţelor decât la studiul corelaţiilor. Butonul „Cells…” permite configurarea datelor ce vor fi prezentate în tabelele de contingenţă.38 – Configurarea datelor în tabele prezintă un interes deosebit pentru subiectul nostru. Reziduurile nu reprezintă altceva decât diferenţa dintre scorul observat şi cel estimat. de obicei. Secţiunea „Counts” are două casete de bifare: „Observed” şi „Expected”. pentru a se identifica modificarea răspunsurilor în urma apariţiei unei situaţii experimentale. ci reprezintă un coeficient care măsoară puterea legăturii dintre prezenţa unui factor şi apariţia unui eveniment. Acestea se pot afişa în formă brută. în cercetări de tipul „înainte şi după”. Celălalt element din această fereastră nu Figura 1.

exprimate însă ca abateri standard în jurul mediei. Sunt însă situaţii în care se pot opera deplasări ori ponderări. Aceste valori pot fi rotunjite sau trunchiate. Opţiunea „Truncate cell counts” are ca efect trunchierea valorilor din baza de date înainte de a se efectua calculele statistice. Este. cu media 0 şi abaterea standard 1. se mai numesc şi reziduuri Pearson. O deplasare cu o valoare fracţionară (spre exemplu o multiplicare a tuturor datelor cu o constantă de tipul 1. din baza de date. atunci înseamnă că numărul de cazuri din acea celulă este mai mare în comparaţie cu situaţia în care cele două variabile ar fi independente. Din acest motiv. dacă doriţi. folosindu-se opţiunile acestei secţiuni.19) va determina afişarea în celulele tabelului a unor numere zecimale. un fel de „etalonare” în unităţi sigma a reziduurilor. Diferenţa dintre rotu njire şi trunchiere constă în faptul că la rotunjire valorile zecimale se transfor- 142 . SPSS va calcula raportul dintre valoarea reziduală brută şi abaterea standard a acestei estimări. numărul de cazuri observate reprezintă numărul de subiecţi. înainte de a se efectua calculele statistice. care au acea caracteristică. Forma standardizată se poate afişa prin bifarea opţiunii „Standardized”. Aceste date sunt reprezentate pe o distribuţie z. Bifarea casetei „Adjusted standardized” permite afişarea reziduurilor în formă standardizată. ca diferenţă între numărul de cazuri observate şi numărul de cazuri estimate. Dacă rezultatul acestui reziduu este pozitiv. Opţiunea „Round cell counts” are ca efect rotunjirea valorilor din baza de date. În mod normal.Statistică aplicată în ştiinţele socio-umane dizată („Unstandardized”). celulele tabelului de contingenţă conţin numere întregi. având aceeaşi semnificaţie ca şi scorurile z. Ca să vă reamintiţi. Secţiunea „Noninteger Weights” are în vedere modul de reprezentare a rezultatelor în celulele tabelului de contingenţă. dacă nu ar exista nicio relaţie între cele două variabile. iar numărul de cazuri estimate (teoretice) se referă la numărul de cazuri care ar trebui să existe în celula respectivă.

opţiunea „No adjustments” nu efectuează nicio ajustare. valorile zecimale se transformă în întregi. în sensul inferior (1. înaintea efectuării oricăror calcule statistice. Desigur. a aceleiaşi variabile (alegând opţiunea „Descending”). înaintea efectuării oricăror calcule statistice. Vom bifa şi caseta „Display clustered bar charts” pentru a forţa SPSS să reprezinte graficul cu bare al acestor variabile şi… cam atât aici.39 – Configurarea formatării datelor Ultimul buton rămas este butonul „Format…” care controlează ordinea de sortare a variabilei reprezentate pe linii. Opţiunea de calcul a testelor de semnificaţie va rămâne cea 143 . În lista „Row(s)” vom include genul biologic iar în lista „Column(s)” includem culoare ochilor. singurele statistici ce pot fi calculate sunt cele bazate pe date nominale. Opţiunea „Truncate case weights” are ca efect trunchierea datelor direct în baza de date. Putem opta pentru o sortare ascendentă a categoriilor variabilei reprezentată pe linii (alegând opţiunea „Ascending”) sau pentru o sortare descendentă. Figura 1. de la mare la mic. să revenim la problemele noastre. Operaţiunile nu afectează datele din baza de date. opţiunile referitoare la construcţia şi analiza t abelelor de contingenţă. ci doar rezultatele calculelor statistice.39 va fi trunchiat la 1). Acestea sunt. Acum.39 va fi rotunjit la 2) iar la trunchiere. Opţiunea „Round case weights” are ca efect rotunjirea datelor direct în baza de date.Cristian Opariuc-Dan mă în întregi în sensul superior (de exemplu 1. Ambele sunt variabile situate la nivel nominal. datele fiind folosite aşa cum sunt. în mare. Ne-am propus să studiem relaţia existentă între genul biologic al persoanelor şi culoarea ochilor.

veţi rămâne surprinşi. Dorim să prezentăm atât frecvenţele aşteptate. Acum. Se poate observa că toţi cei 50 de subiecţi au scoruri la cele două variabile.44– Sumarul analizei Case Processing Summary Cases Valid N Genul biologic * Culoarea ochilor Percent Missing N 0 Percent . Butonul „Statistics…” ne interesează ceva mai mult. Se poate observa reprezentarea pe coloane a variabilei „culoarea ochilor”. ne interesează şi toate reziduurile. pentru a calcula coeficienţii χ2. datele sunt utilizabile 100%. putem apăsa butonul „Continue” pentru a reveni la formularul iniţial şi apoi butonul „OK” în vederea lansării analizei. vom calcula coeficientul de contingenţă şi coeficienţii φ şi v Cramer. deoarece nu suntem în situaţia de a încerca predicţii şi nici nu avem variabile situate la vreun nivel superior de măsură. SPSS a generat nu mai puţin de patru tabele şi un grafic. Datele din acest tabel ne oferă informaţii valoroase referitoare la structura internă a analizei şi vor trebui incluse în orice raport de cercetare.0% 50 100. în secţiunea „Nominal”.0% N Total Percent 50 100.Statistică aplicată în ştiinţele socio-umane implicită – opţiunea asimptotică.0% Primul tabel se referă la sumarul analizei. Apăsând butonul „Cells…” vom comunica programului modalitatea de afişare a rezultatelor. Al doilea tabel nu este altceva decât tabelul încrucişat de contingenţă. Tabelul 1. De asemenea. Aici vom bifa caseta „Chi-Square”. După bifarea opţiunilor respective. în timp ce pe linii este reprezentată variabila „gen biologic”. Iată o primă situaţie în care ar 144 . nu există cazuri lipsă. astfel încât putem ignora butonul „Exact…”. Celelalte casete nu le vom bifa. dacă veţi privi în fereastra de afişare a rezultatelor. cât şi cele observate.

2 7 7.5 pentru ochi negri. spre exemplu. Residual Adjusted Residual Total Count Expected Count 5 5. Dacă numărul de cazuri este relativ mic.45– Tabelul de contingenţă Genul biologic * Culoarea ochilor Cross tabulation Culoarea ochilor Albastri Verzi Caprui Negri Total Genul biologic Masculin Count Expected Count Residual Std.4 .0 5 5. este de preferat să utilizăm rotunjirea. vom folosi trunchierea. Residual Adjusted Residual Feminin Count Expected Count Residual Std.0 16 16. T otuşi.6 .6 .4 .4 -.6 . Beneficiem de mai multă informaţie în detrimentul preciziei.1 .0 50 50. 7. ce înseamnă.3 -.2 -.4 pentru ochi albaştri. însă.4 8 8. 7 cu ochi căprui şi 3 cu ochi negri.4 -.2 23 23. 5 au ochi verzi. pentru bărbaţi. tru nchierea şi când folosim rotunjirea? În general. sunt 5.4 3 3.5 -. dacă baza de date conţine un număr mare de cazuri.4 3 2. câştigăm precizie.2 . 5.6 pentru ochi căprui.0 145 .4 .4 8 8.4 -. 5 au ochi albaştri.4? Înseamnă cumva cinci bărbaţi şi jumătate? La acest nivel de măsură ar fi fost mai bine să folosim opţiunile de rotunjire pentru a evita asemenea exprimări zecimale. fără afectarea bazei de date.4 -.Cristian Opariuc-Dan fi trebuit să folosim opţiunile de rotunjire sau trunchiere. Tabelul 1.5 -. Similar.2 -.0 8 7.4 pentru ochi verzi. am investigat 16 femei.5 . 5.5 .3 .4 -. 16 au ochi căprui şi 8 au ochi negri.4 11 11.0 16 15. Dintre aceştia. Ce ne spune acest tabel? În primul rând avem un număr de 34 de bărbaţi. Frecvenţele estimate. 3 cu ochi verzi.4 3 2. Veţi vedea imediat de ce.3 .1 -.4 -. 3 cu ochi albaştri.0 34 34. 15. Când folosim. Chiar dacă pierdem informaţie. Situaţia este redată în mod analog şi pentru femei.

948 . în timp ce femeile se situează sub frecvenţa aşteptată la culorile închise (căprui şi negri).44. Presupunerile anterioare se confirmă în tabelul 1.361a . (2sided) . 3 cells (37. Observăm că pentru culorile deschise (albaştri şi verzi) bărbaţii se situează sub frecvenţa aştept ată. The minimum expected count is 2.085 .948 146 . Ne-am putea gândi la o predominanţă a culorilor închise pentru bărbaţi şi a culorilor deschise pentru femei.085 .46– Coeficientul de contingență χ2 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases . deşi forma standardizată a reziduurilor arată abateri mici de la situaţia în care nu ar exista nici o relaţie între cele două variabile. Observăm că nu există nicio legătură între cele două variabile.5%) have expected count less than 5. .571 a.47– Coeficienţi de asociere derivaţi din χ2 Symmetric Measures Value Nominal by Nominal Phi Cramer's V Contingency Coefficient N of Valid Cases .948 .948 .320 50 df 3 3 1 Asymp.949 . putem să nu respingem ipoteza nulă conform căreia nu există nicio legătură între culoarea ochilor şi genul biologic al subiecţilor.359 . 2 Tabelul 1. Sig.Statistică aplicată în ştiinţele socio-umane Următoarele linii din tabel se referă la reziduuri. Tabelul 1. Sig.085 50 Approx. Într-adevăr. Absenţa legăturii este confirmată şi de coeficienţii de asociere derivaţi din χ . Nu se poate stabili nicio relaţie între culoarea ochilor şi genul biologic al subiecţilor.56.

la ambele sexe şi o oarecare frecvenţă mai ridicată a ochilor negri la bărbaţi. Să presupunem că dorim să aflăm relaţia dintre culoarea ochilor şi gradul militar. Prin urmare. coeficient care relaţionează o variabilă nominală cu una ordinală sau scalară. pentru a vă putea familiariza cu procedurile de lucru. fără a intra în det alii. coloneii au „ochi albaştri”. Suntem în situaţia analizei legăturii între o variabilă nominală (culoarea ochilor) şi o variabilă ordinală (gradul militar). adică să vedem dacă. fie folosim coeficientul η.40 – Reprezentarea grafică a relaţiei dintre continuare o frecvenţă scăzuculoarea ochilor şi genul biologic. vom furniza câteva exemple. la fel cum am procedat anterior. Graficul arată doar o preponderenţă a ochilor căprui.Cristian Opariuc-Dan Reprezentarea grafică a datelor vine în sprijinul demonstraţiei cifrice. tă. Iată că. apoi alegem opţiunile „ Chi- 147 . sa putut demonstra o ipoteză de cercetare. Culorile deschise au în Figura 1. Bifăm şi caseta „Display clustered bar charts” pentru a putea afişa grafic variabilele. atât la bărbaţi cât şi la femei. Înainte de a încheia. prin procedee neparametrice. În acest caz avem două posibilităţi. Fie abordăm analiza la nivel nominal. situate chiar la un nivel nominal. Noi vom aborda ambele situaţii. includem pe linii variabila „culoarea ochilor” şi pe coloane „gradul militar”. într-adevăr. Genul persoanelor investigate nu are nicio legătură cu culoarea ochilor acestora. deoarece una dintre variabile se află la acest nivel şi aplicăm principiul „an alizei bazate pe variabila cea mai slabă”.

Statistică aplicată în ştiinţele socio-umane square”. (2-sided) Monte Carlo Sig.168 .149 . apăsăm butonul „OK” pentru a lansa analiza.758 Upper Bound . The standardized statistic is -.122 . dar şi opţiunea „Eta” din fereastra de configurare a statisticilor. Nu vom furniza toate tabelele. (2-sided) Sig.384 .351. dar şi pentru metoda Monte Carlo. majoritatea fiind identice cu ele din analiza de mai sus.200 . se poate observa creşterea preciziei pra- 148 .80.004a 14.779 . Constatăm că statisticile bazate pe χ2 sunt mult mai elaborate la utilizarea metodei Monte Carlo.210b .002 11. „Phi and Cramer’s V”. tabelul coeficienţilor de asociere derivaţi din χ2. Sig. independenţa celor două variabile.123c 50 1 df 9 9 Asymp.220 .409 Sig. c. Based on 10000 sampled tables with starting seed 2000000. 99% Confidence Interval Lower Bound Upper Bound a.397b . b. asimptotică.158b . Toţi cei trei coeficienţi de asociere calculaţi arată. din nou. Avem pragurile de semnificaţie atât pentru m etoda clasică. The minimum expected count is . „Contingency coefficient”.149 . (1-sided) 99% Confidence Interval Value Pearson Chi-Square Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases 13. aşa cum reiese şi din tabelul 1.162 . În final. nu există nicio legătură între cele două variabile. .48– Coeficienţi de asociere χ2 Chi-Square Tests Monte Carlo Sig. alături de intervalele de încredere. Desigur. Oricum.725 . Tabelul 1.3%) have expected count less than 5.168 .159b . Vom considera că una dintre variabile nu îndeplineşte condiţiile testării asimptotice şi vom alege metoda „Monte Carlo” din fereastra de configurare a testelor de semnificaţie.769b Lower Bound . 13 cells (81.47.963 .

de asemenea.149 . Sig. De aceea. ea fiind tratată la analizele folosind date nominale. aşadar. prin urmare furnizează ambele valori. lipsa pragului de semnificaţie. variabila dependentă este „gradul militar” iar cea independentă „culoarea ochilor”.184 Remarcăm valoarea mică a acestei legături şi. Ultimul tabel analizat este cel al coeficientului de asociere η.158a .158 . Aici va trebui să facem câteva precizări.162 . coeficientul η va fi întotdeauna însoţit de analize bazate pe χ2.168 .149 . Tabelul 1.158a a. Based on 10000 sampled tables with starting seed 2000000. 149 .Cristian Opariuc-Dan gului de semnificaţie la utilizarea metodei Monte Carlo în comparaţie cu testul clasic.294 . 99% Confidence Interval Value Approx.184).49– Coeficienţi de asociere derivaţi din χ2 Symmetric Measures Monte Carlo Sig. Nominal by Nominal Phi Cramer's V Contingency Coefficient N of Valid Cases . Tabelul 1. SPSS nu are de unde să ştie care este variabila dependentă şi care este vari abila independentă. a Lower Bound Upper Bound .149 . SPSS nu furnizează valoarea semnificaţiei pentru acest coeficient. Acest lucru înseamnă că avem o variabilă dependentă (variabila situată la nivel scalar) şi o variabilă independentă (variabila situată la nivel nominal).510 .162 . În cazul nostru. Coeficientul care ne interesează este.120 . deoarece asocierea se tratează direcţional.454 50 Sig.168 .50– Coeficientul de asociere nominal – ordinal η Directional Measures Value Nominal by Interval Eta Culoarea ochilor Dependent Grad militar Dependent .168 . situat pe a doua linie – linia carte tratează gradul militar (η=0.162 .

lansaţi analiza şi luaţi-vă o mică pauză. Apoi salvaţi dacă aţi lucrat ceva. Errora Approx.000 .000 c . semnificative şi puternice între gradul militar şi ultima şcoală absolvită. Glumeam! Numărul mic de date permite analiza rapidă a acestora. Not assuming the null hypothesis.034 . „gen biologic” şi „greutate”. relaţia nefiind un fapt surprinzător.041 . Kendall’s tau-b” şi „Kendall’s tau-c”.127 10.000 . Explicaţi şi argumentaţi utilizarea coeficienţilor. astfel încât putem bifa şi caseta „Correlations”. alegeţi opţiunea „Exact” cu limitare la 5 minute. b.040 . . gradele militare înalte presupun şi studii pe măsură. dar şi ceilalţi coeficienţi de corelaţie pentru date ordinale: „Gamma”. .Statistică aplicată în ştiinţele socio-umane Un ultim exemplu îşi propune analiza relaţiei dintre ultima şcoală absolvită şi gradul militar.000 . Coeficienţii au valori ridicate.000 .51– Coeficienţi de corelaţie pentru date aflate la nivel ordinal Symmetric Measures Value Ordinal by Ordinal Kendall's tau-b Kendall's tau-c Gamma Spearman Correlation Interval by Interval Pearson's R N of Valid Cases a.040 .000 . „Sommers’ d”.780 50 Asymp.000 Exerciţii: Analizaţi şi interpretaţi legăturile dintre: „gen biologic” şi „grad militar”.127 16.661 . cât şi de testul exact. „culoarea ochilor” şi „ultima şcoală absolvită”.742 . fapt care indică existenţa unei legături pozitive. Sig. Std.000 . Observăm că legătura dintre cele două variabile este semnificativă la un prag de semnificaţie mai mic de 0. 150 .127 16. Tb Approx. pentru a vedea cum funcţionează şi acest element. prag furnizat atât de testul clasic de semnificaţie. Tabelul 1.041 16. Using the asymptotic standard error assuming the null hypothesis. Desigur.629 . Exact Sig.942 .000 .01.000c .823 . Ambele variante se află la nivel ordinal.025 8. Based on normal approximation. Dacă aveţi curaj. c.

decât după ce vom realiza câteva referiri generale la modul de raportare al studiilor corelaţionale. să experimentaţi mai multe variante. doar pentru coeficienţii direcţionali. deoarece numai aşa veţi putea să vă perfecţionaţi. Nu vom scrie p<0. însă. I.01 ci p< . acest lucru rămânând la latitudinea.5. Desigur. La fel raportăm şi pragul de semnificaţie. nu există un şablon standard de raportare. Desigur. experienţa şi talentul cercetătorului. modul în care se pot raporta studiile de tip corelaţional. Unii autori (Field. în general mai mult sau mai puţin acceptate şi respectate: 1. sub forma varianţei comune. deoarece reprezintă o exprimare redundantă. dată de valoarea coeficientului de corelaţie. şi pragul de semnificaţie au o amplitudine cuprinsă între 0 şi 1. atâta timp cât şi coeficientul.Cristian Opariuc-Dan Vă voi lăsa acum în compania SPSS. În mod normal. o respect în lucrările ştiinţifice şi vă recomand şi dumneavoastră să o faceţi. 2000) afirmă că este importantă raportarea efectului. Desigur.01 sau p< .3 Raportarea studiilor corelaţionale Pe parcursul acestui capitol am făcut deseori referire la stilul. să vă jucaţi cu opţiunile şi cu i ndicatorii corelaţiilor. 151 . Nu vom încheia. Nu se recomandă scrierea cifrei 0 înaintea punctului zecimal. sensul corelaţiei. acest capitol.05. nu se recomandă publicarea unui coeficient de corelaţie r Bravais-Pearson sub forma r=0. pot fi formulate şi o serie de reguli. dat de semnul coeficientului de corelaţie şi pragul de semnificaţie. eu nu am respectat această regulă din considerente didactice. Am menţionat deja că la raportarea unei corelaţii sunt importante trei elemente: intensitatea corelaţiei. Există însă o serie de principii generale. a căror respectare vă poate scuti de surpriza neplăcută a respingerii vreunei lucrări.57 sau r= .57.57. ci în forma r= . Prin urmare.

acesta fiind şi standardul raportărilor ştiinţifice.01. coeficientul de corelaţie Bravais-Pearson se reprezintă prin litera r. 5. aceasta este o ipoteză unilaterală. p(onetailed) < .05. situaţie care trebuie evitată). Se recomandă precizarea situaţiei în care s-a utilizat o ipoteză unilaterală (unidirecţională). ipotezele bilaterale nu se specifică. r= . pragul de semnificaţie acceptat este de . nu folosiţi niciodată expresia p= . însoţită de formulele. Dacă aveţi o ipoteză de tipul „există o legătură pozitivă între anxietate şi depresie”.003 ci expresii de forma p< . De exemplu.01 3. 4. Sunt semnificative doar pragurile mai mici de .01 sau p< .05. dacă publicaţi în străinătate.05. expresiile de calcul.Statistică aplicată în ştiinţele socio-umane 2. ci se specifică doar ipotezele unilaterale. considerarea ipotezei ca fiind bilaterală. de obicei raportăm semnificaţii mai mici de . în general. în situaţia în care folosiţi alte simboluri (repet. implicit. nu şi cele egale cu această valoare. Un prag de semnificaţie p= .001. după cum aţi observat. sunteţi obligat să furnizaţi o legendă explicativă a acestora. o cercetare nu implică raportarea exactă a acestui prag ci raportarea sub forma unei inegalităţi.05 sau mai mici de . În ştiinţele socio-umane. Aşadar. coeficientul Spearman prin ρ şi aşa mai departe. p< . În general. Neprecizarea acestui lucru determină. în general acceptată în literatura de specialitate.87. Fiecare coeficient de corelaţie se exprimă printr-o anumită literă. Totuşi.05 nu este semnificativ.01 sau. În ştiinţele sociale. Va trebui să respectaţi această notaţie. p(unilateral) < .87. Regula impune o raportare de genul r= . Foarte rar 152 . Am susţinut deja că.000 sau p= .

Cristian Opariuc-Dan ajungem la niveluri mai mici de .001 şi în mod excepţional la praguri de semnificaţie mai mici de .0001. În sfârşit, am ajuns şi la finalul acestui capitol. A fost, într-adevăr, un capitol destul de lung, însă şi informaţia a fost consistentă. Acum, sper că aveţi o idee precisă asupra semnificaţiei conceptului de corelaţie, mai exact a celui de legătură între variabile. Puteţi, să fiţi mândri şi să daţi lecţii colegil or în domeniul studiilor corelaţionale, însă nu vă bucuraţi prea tare, deoarece avem de discutat lucruri cel puţin la fel de interesante. Luaţi-vă o pauză. Mergeţi la un grătar, la iarbă verde, relaxaţi -vă, deoarece imediat vom aborda un alt capitol, şi anume cel al testelor statistice. În concluzie:
     Relaţiile stabilite în urma analizei a două variabile poartă numele de analize biv ariate, spre deosebire de analizele univariate care au în vedere doar o singură var iabilă; Gradul de asociere între două variabile se bazează pe conceptul ce covarianţă. Măsura standardizată a covarianţei poartă numele de corelaţie; Coeficienţii de corelaţie pot fi parametrici şi neparametrici, după cum cele două variabile îndeplinesc sau nu condiţiile de aplicare ale statisticilor parametrice; Coeficientul de corelaţie al rangurilor ρ Spearman se poate folosi, în general, pe ntru variabile ordinale provenite din variabile continui sau pentru variabile continui care nu îndeplinesc condiţiile necesare aplicării statisticilor pa rametrice; Coeficientul de corelaţie al rangurilor τ Kendall, are mai multe forme, se bazează pe calculul inversiunilor şi al proversiunilor şi se foloseşte pentru variabile aflate natural la un nivel de măsură ordinal sau pentru variabile cantitative care nu îndeplinesc condiţiile de aplicare a statisticilor parametrice; Coeficientul de contingenţă χ2 are mai multe forme şi se foloseşte în cazul variabilelor nominale, în calcule bazate pe tabele de contingenţă. Este un coeficient nedire cţional şi nestandardizat; Coeficientul de asociere φ este o formă standardizată a coeficientului χ2 şi se utilizează, în general, pentru două variabile dihotomice. În cazul în care una dintre v ariabile nu mai este dihotomică, acest coeficient nu are relevanţă; Coeficientul de contingenţă Pearson (cc) este o variantă a coeficientului φ, care poate fi utilizată pentru variabile cu mai multe categorii; Coeficientul de contingenţă Tschuprow (t) se bazează tot pe coeficientul φ şi ţine seama de acesta şi de numărul de categorii din cadrul fiecărei variabile, fiind o formă ajustată a coeficientului φ;

   

153

Cristian Opariuc-Dan (formula 8.5)

( )

Dacă vom aplica formula pe cazul anterior, vom obţine la un nivel de precizie de ±5%: ( ) Observăm că valoarea se apropie mult de cea obţinută anterior prin corecţie.

VIII.4 Construcţia eşantioanelor în SPSS
SPSS prezintă un instrument foarte puternic de creare a eşantioanelor în condiţiile în care aveţi la dispoziţie baza de eşantionare. Cu ajutorul programului SPSS, puteţi crea următoarele tipuri de eşantioane:     Eşantioane simple aleatorii, cu sau fără înlocuire; Eşantioane stratificate şi pe clusteri; Eşantioane multistadiale; Eşantioane probabilistice proporţional cu mărimea sau tipuri de eşantioane nealeatorii.

Figura 8.4 – Meniul de creare şi analiză a eşantioanelor

Structura eşantioanelor în SPSS se prezintă sub forma unor fişiere tip plan. Există două categorii de planuri:   Planul de eşantionare – conţine specificaţiile de definire a eşantionului; Planul de analiză – conţine date necesare procedurilor de analiză complexă pentru a calcula varianţa eşantionului. Planul

285

Statistică aplicată în ştiinţele socio-umane

include structura eşantionului, metodele de estimare pentru fiecare stadiu, referinţele la variabilele de interes. Debutul procedurii de creare a unui eşantion se face prin deschiderea bazei de eşantionare. Vom folosi, în acest scop, o bază de date pusă la dispoziţie de SPSS Inc., situată în directorul în care s-a instalat aplicaţia. Baza de date se numeşte „1991 U.S. General Social Survey.sav” şi conţine un număr de 1517 înregistrări, reprezentând rezultatele unui sondaj efectuat în Statele Unite. Deoarece volumul de date este destul de mare, având şi o serie de v ariabile factuale şi demografice, putem folosi acest fişier ca exemplu pentru baza noastră de eşantionare.

VIII.4.1

Crearea unui eşantion în SPSS

Proiectarea unui nou plan de eşantionare se realizează prin apelarea meniului „Analyze”, iar din submeniul „Complex Samples” se alege opţiunea „Select a Sample…”. Crearea unui eşantion este asistată de un program special („Wizard” sau asistent) care presupune mai mulţi paşi.

Figura 8.5 – Primul pas al creării unui eşantion. Salvarea fişierului plan

Prima fereastră afişată ne solicită alegerea unui fişier în care va fi stocat planul de eşantionare. Opţiunea implicită este „Design a sample”, pe care o vom folosi pentru a specifica locaţia şi numele planului de eşantionare. Vom putea introduce direct calea către fişierul ce urmează a fi salvat sau vom 286

Avem prezentate. Pentru a se putea îmbunătăţi precizia estimărilor. la fel ca mai sus. Evident.Cristian Opariuc-Dan putea apăsa butonul „Browse…” pentru a alege locul pe hard-disc unde va fi salvat planul de eşantionare. puteţi folosi opţiunea „Draw a sample”. sunt afişate opţiunile acestui stadiu. Observaţi că extensia fişierelor de tip plan de eşantionare este „. după care alegeţi fişierul plan dorit.csplan” şi a fost salvat direct pe discul C:\. Folosind butoanele de transfer (butoanele săgeată). În cazul nostru. veţi putea reconfigura sau elimina stadii din cadrul unui plan de eşantionare multistadial creat anterior. având o structură arborescentă. acest plan de eşantionare va trebui iniţial deschis prin tast area căii către fişierul de tip . Dacă aveţi deja un plan de eşantionare făcut şi doriţi să creaţi un eşantion în baza acestuia.csplan”. În urma acestei selecţii se obţin eşantioane separate pentru fiecare strat. A doua fereastră presupune definirea planului de eşantionare. vom putea include aceste variabile în secţiunea „Stratify By”. Cu ajutorul acesteia. aveţi la dispoziţie opţiunea „Edit a sample design”. Evident. Prima opţiune implică precizarea variabilelor de eşantionare în cazul unor eşantioane care presupun acest lucru (opţiunea „Design variables”). am denumit fişierul „Test. Trecerea la următoarea etapă se face prin intermediul butonului „Next”. Se vor putea preciza astfel straturile sau subpopulaţ iile (amintiţi-vă de boabele de fasole de 1 an şi de 10 ani). dacă dorim un eşantion stratificat după acea variabilă.csplan sau folosind butonul „Browse…”. În partea stângă. toate variabilele din baza de eşantionare. în secţiunea centrală. unităţile din fiecare strat vor fi cât mai omogene din punctul de vedere al caracteristicii estimate. 287 . va trebui să furnizăm şi un nume pentru acest fişier. Pentru a modifica un plan de eşantionare existent. Puteţi oricând abandona operaţia apăsând pe butonul „Cancel” sau puteţi parcurge sistemul de asistenţă contextuală prin accesarea butonului „Help”.

între clusteri trebuie să existe o eterogenitate cât mai mare sub aspectul variabilei de interes. folosind caseta de text „Stage Label”. Dacă planul de eşantionare este parte dintr-un plan de eşantionare mai complex. Pentru claritate.Statistică aplicată în ştiinţele socio-umane Figura 8. variabilă ce reprezintă dimensiunea unui eşantion construit într-un stadiu anterior. Pe ntru a se evita pierderea preciziei şi a compensa dezavantajele eşantionării pe clusteri. 288 .6 – Pasul 2: Definirea variabilelor cercetării O variabilă introdusă în secţiunea „Clusters” permite crearea unui eşantion pe clusteri în care se definesc grupuri de unităţi de observaţie. se poate introduce un scurt text care va descrie stadiul în curs. puteţi introduce o variabilă numerică în secţiunea „Input Sample Weight”.

Observăm existenţa doar a eşantioanelor de tip randomizat – simplu. vor fi disponibile doar opţiunile de acest tip. Din această listă vom alege eşantionul simplu randomizat (opţiunea „Simple Random Sample”).7 – Pasul 2: Alegerea metodei de eşantionare SPSS permite selectarea. Deoarece nu am inclus nici o variabilă în etapa anterioară – optând pentru un eşantion simplu randomizat – . „Method”. în caseta de selecţie „Type” din cadrul secţiunii „Method”. în funcţie de variabilele precizate în etapa anterioară. Deocamdată nu ne interesează în mod deosebit opţiunile prezentate. a mai multor tipuri de eşantioane. permite stabilirea tehnicii de eşantionare pe care o folosim.Cristian Opariuc-Dan În acest exemplu. sistematic şi secvenţial. sistematic şi secvenţial şi a eşantioanelor de tip pr oporţional cu mărimea – PPS simplu. vom dori să construim un eşantion simplu randomizat. 289 . Figura 8. Următoarea secţiune.

tipurile de metode ce pot fi alese în această etapă sunt:  Simple Random Sampling – eşantion aleatoriu simplu. Unităţile sunt selectate cu un pas fix de eşantionare din baza de eşantionare. Cu alte cuvinte. Simple Systematic – eşantion sistematizat simplu (cu pas). în care unităţile sunt selectate cu o probabilitate egală. forţarea metodei cu introducerea bilei în urnă. existând posibilitatea unei noi selecţii – în cazul WR. bifând caseta „Use WR estimation for analysis”. Opţiunea permite. Pe scurt. o unitate selectată în eşantion va fi eliminată de la următoarele posibile selecţii – în cazul WOR – sau nu va fi eliminată. de asemenea. dacă s-au specificat anterior variabilele de stratificare. Selecţia se face fără introducerea bilei în urnă. exceptând configurarea anterioară a unui eşantion pe clusteri. comunicaţi programului SPSS să estimeze această probabilitate de reincludere a unui element în eşantion. Se poate folosi şi în cazul eşantionării stratificate. Orice unitate se selectează cu reintroducerea bilei în urnă. Metoda poate fi folosită cu sau fără reintroducerea bilei în urnă. Implicit. există posibilitatea de a efectua selecţia fără „reintroducerea bilei în urnă” – opţiunea „Without replacement (WOR)” sau „cu reintroducerea bilei în urnă” – opţiunea „With replacement (WR)”. chiar dacă metoda de eşantionare presupune o selecţie fără introducerea bilei în urnă. Simple Sequential – unităţile sunt extrase secvenţial cu probabilitate egală şi fără introducerea bilei în urnă.Statistică aplicată în ştiinţele socio-umane La nivelul acestei etape. PPS – eşantion proporţional cu mărimea în care unităţile sunt extrase aleatoriu cu o probabilitate proporţională cu mărimea.    290 . În acest din urmă caz. metoda de estimare este specificată în fişierul plan şi este consistentă cu tipul de eşantion selectat.

Cristian Opariuc-Dan    PPS Systematic – eşantion proporţional cu mărimea de tip sistematic. fără introducerea bilei în urnă. Determinarea mărimii eşantionului reprezintă ultima acţiune din acest stadiu. Aceste valori pot fi definite în mod explicit. se poate preciza amplitudinea acestor dimensiuni. Necesită.   Opţiunea „Measure of Size (MOS)” se aplică eşantioanelor de tip PPS – proporţionale cu mărimea – şi implică precizarea unei dimensiuni definitorii pentru mărimea fiecărei unităţi. specificarea unui variabile pentru cluster. PPS Murthy – un eşantion similar celui anterior. Necesită precizarea unei variabile de tip cluster. De asemenea. PPS Brewer – eşantion proporţional cu mărimea în care sunt selectate două clustere din fiecare strat cu o probabilitate proporţională cu mărimea clusterului. introducând valorile minime şi maxime în casetele de text „Minimum” respectiv „Maximum”. de asemenea. extrase fiind dintr-o variabilă (prin bifarea opţiunii „Read from variable” şi introducerea variabilei din care vor fi extrase datele) sau pot fi calculate automat selectând „Count data records”. Pentru baza noastră de date. un eşantion cu o marjă de eroare de 2% şi un interval de încredere de 95% implică un număr de 930 de subiecţi. pentru a fi reprezentativ. PPS Sequential – eşantion proporţional cu mărimea de tip secvenţial. Diferă doar metoda statistică prin care sunt alese unităţile. PPS Sampford – eşantion proporţional cu mărimea care selectează mai mult de doi clusteri din fiecare strat cu o probabilitate proporţională cu mărimea clusterului şi fără introducerea bilei în urnă. 291 .

Statistică aplicată în ştiinţele socio-umane Acest pas presupune specificarea numărului sau a proporţiei în care vor fi selectate unităţile de eşantionare. În modul numărului fix.8 – Pasul 2: Stabilirea dimensiunii eşantionului Caseta de selecţie „Units” permite alegerea între un număr fix de unităţi selectate – alegând opţiunea „Counts” – şi o proporţie de unităţi în eşantion – alegând opţiunea „Proportions”. în condiţiile în care dimensiunile straturilor nu sunt egale. Figura 8.10 pentru 10% din populaţie). vom include proporţia din populaţie pe care o regăsim în eşantion (de exemplu 0. Dimensiunea eşantionului poate fi fixă sau poate varia în funcţie de straturi. 292 . 930). Opţiunea „Unequal values for strata” permite introducerea valorilor eşantionului pentru fiecare strat definit. Dacă optăm pentru proporţii. Opţiunea „Value” permite aplicarea unei valori unice pentru toate straturile. va trebui să introduceţi valoarea dimensiunii eşantionului (în cazul nostru.

Cristian Opariuc-Dan „Read values from variable” permite selectarea unei variabile numerice. nu mai puţin de 50 – „Minimul” şi nu mai mult de 200 – „Maximum”). de asemenea. specifica limitele inferioare şi superioare ale numărului de unităţi care vor fi selectate (de exemplu. astfel:  Bifând caseta „Population size”. în care sunt stocate dimensiunile fiecărui strat. În baza de date. Figura 8. putem. La alegerea eşantionului bazat pe proporţii. Apăsarea butonului „Next” determină afişarea ferestrei variabilelor care urmează a fi calculate. 293 .9 – Pasul 3: Alegerea variabilelor eşantionului Pe parcursul acestei etape putem preciza ce variabile vor fi salvate în baza de date în urma creării eşantionului. vom comunica aplicaţiei crearea unei variabile care va stoca numărul estimat de unităţi din populaţie la un anumit stadiu. această variabilă va începe cu „PopulationSize_”.

294 . se va crea o variabilă ce va conţine proporţia eşantionului selectat din populaţie. Numele variabilei va începe în baza de date cu „SampleWeightCumulative_”. De exemplu.   Ca regulă generală. Indexul – permite specificarea unităţilor selectate de mai multe ori la nivelul unui stadiu. Variabila va începe cu „SamplingRate_”. variabilă identificată prin „Index_”.Statistică aplicată în ştiinţele socio-umane  Bifând caseta „Sample size”. Bifând caseta „Sample proportion”. în baza de date va fi creată automat o serie de noi variabile. Variabila este salvată doar în condiţiile în care se foloseşte opţiunea „cu introducerea bilei în urnă”. Mărimea cumulată – mărimea cumulată a eşantionului de la un stadiu la altul. În baza de date. vom putea salva o variabilă care să conţină numărul de unităţi selectate la un anumit stadiu. variabilă identificată prin „InclusionProbability_”. de o cifră care indică stadiul. comunicăm programului SPSS să creeze o variabilă ce va stoca inversul probabilităţilor de includere a unui element în eşantion. după linia de subliniere. această variabilă va începe cu „SampleSize_”. în baza de date. Bifând caseta „Sample weight”. iar variante ale acestei variabile au un rol important în procesul de analiză a eşantionului. fiecare variabilă nou creată va fi urmată.   Alături de aceste variabile. după cum urmează:  Probabilitatea de includere – proporţia unităţilor selectate la nivelul unui anumit stadiu. variabilă identificată prin „SampleWeightCumulative_”.

Figura 8. Obţinem scurte informaţii despre numărul stadiului. totuşi. s-a activat şi butonul „Finish”. pentru primul stadiu. la un moment dat. selectând opţiunea „Yes. dimensiunea eşantionului şi metoda de eşantionare folosită.Cristian Opariuc-Dan probabilitatea de includere a unei unităţi în eşantion. Am observat că. întregul proces pentru a putea analiza etapele acestui instrument. Acest lucru înseamnă că SPSS are deja suficiente informaţii pentru a crea eşantionul şi putem sări peste paşii rămaşi. În exemplul nostru. va apărea în baza de date sub forma „InclusionProbability_1_”. am bifat salvarea tuturor variabilelor în baza de date în vederea comentării ulterioare a câtorva cazuri. Apăsarea butonului „Next” permite trecerea la următorul pas al creării eşantionului. add stage 2 now”. avem posibilitatea creării unui nou stadiu. La acest nivel. în cazul în care 295 . variabila de stratificare. variabila de cluster.10 – Pasul 4: Sumarul stadiului Noua etapă afişează sumarul stadiului curent. Noi vom parcurge. eticheta acestuia – în cazul în care am definit una –.

ne putem întoarce la etapele anterioare.11 – Pasul 5: Crearea eşantionului. astfel încât vom apăsa butonul „Next”. De asemenea. Putem alege crearea eşantionului. prin selectarea numărului acestuia. Stadii- 296 . care este. alegând „All” din lista derulantă sau crearea eşantionului doar pentru un anumit stadiu. selectând „Yes”. do not add another stage now”. Sistemul ne întreabă dacă dorim să creăm acum eşantionul („Do you want to draw a sample?”). Opţiuni de selecţie Noua fereastră prezintă o serie de opţiuni care iniţiază modalitatea de creare efectivă a eşantionului. alegând „No. fără alte stadii suplimentare. nu suntem interesaţi decât de crearea unui eşantion simplu aleatoriu. Figura 8. sau posibilitatea iniţierii etapelor de creare efectivă a eşantionului. apăsând butonul „Back”. Pentru moment. de fapt. situaţie în care vom avea posibilitatea de generare a tuturor stadiilor. şi varianta implicit selectată.Statistică aplicată în ştiinţele socio-umane ne interesează o eşantionare multistadială.

Prin urmare. În cele două situaţii . SPSS va proceda la o nouă resortare. 297 . Putem opta între baza de date curentă („Active dataset”). iar debifarea acesteia ignoră unităţile care au date lipsă. va trebui să precizăm numele bazei de date.Cristian Opariuc-Dan le pot fi generate doar în ordine. generat automat de computer (selectând „A randomly-chosen number”) sau putem include o valoare în caseta de text „Custom value”. caz în care SPSS va selecta din baza de eşantionare unităţile incluse în eşantion şi va calcula variabilele necesare doar pentru acestea. Bifarea primei casete are ca efect includerea într-o categorie separată a unităţilor cu date lipsă. Altminteri. putem alege o nouă bază de date („New dataset”). operaţiune consumatoare de timp. caz în care SPSS va crea o nouă bază de date. în care va include doar unităţile selectate în eşantion sau putem crea o nouă bază de date cu salvare („External file”). Bifarea celei de-a doua casete are ca efect accelerarea procesului de generare a eşantionului. în situaţia în care se doreşte reproducerea caracteristicilor eşantionului. nu putem crea stadiul 3 în condiţiile în care nu au fost executate stadiile 1 şi 2. respectiv numele şi calea către fişierul de date. în condiţiile în care datele sunt deja sortate după valorile unei variabile de stratificare. Următoarea etapă permite precizarea locului în care va fi salvat eşantionul şi variabilele pe care acesta le generează. Cele două casete de bifare permit tratarea cazurilor în care lipsesc informaţii la nivelul unor elemente şi accelerarea procesului de generare a eşantionului. Putem alege între un număr oarecare. caz similar celui anterior. Secţiunea „What type of seed value do you want to use?” permite stabilirea valorii de iniţializare pentru generatorul de numere aleatoare. nesalvată. singura deosebire fiind aceea că SPSS va crea un nou fişier pe disc şi va salva eşantionul.

am ales salvarea eşantionului în aceeaşi bază de date. pentru a putea urmări mai uşor procesul de selecţie.Statistică aplicată în ştiinţele socio-umane Figura 8. 298 . Apăsarea butonului „Next” permite trecerea la ultima etapă a creării eşantionului. Regulile de selecţie ale cazurilor („Case selection rules”). Opţiuni de salvare În această fereastră se mai află un număr de două elemente:  Fişierul în care vor fi salvate probabilităţile cumulate („Joint probabilities”). Opţiunea este utilă la construirea sub-stadiilor. în cazul în care se generează un singur stadiu la un moment dat şi se doreşte salvarea regulilor de selecţie a cazurilor într-un fişier separat. în cazul în care se folosesc eşantioane proporţionale cu mărimea şi fără introducerea bilei în urnă.  În situaţia noastră.12 – Pasul 5: Crearea eşantionului.

Figura 8. vom alege prima opţiune şi vom apăsa apoi butonul „Finish”. Evident. Observăm că avem un singur stadiu.Cristian Opariuc-Dan Ultima fereastră ne întreabă dacă dorim să salvăm designul realizat în planul de eşantionare şi să creăm efectiv eşantionul (opţiunea „Save the design to a plan and draw the sample”) sau dorim să copiem într-un fişier de sintaxă comenzile SPSS generate în urma prelucrărilor noastre (opţiunea „Paste de syntax generated by the Wizard into a syntax window”). SPSS procedează la crearea eşantionului şi ne oferă o serie de informaţii în fereastra de rezultate (Output).13 – Pasul 6: Crearea eşantionului După câteva fracţiuni de secundă. metoda de selecţie este simplu aleatorie fără reintroducerea bilei în urnă. Primul tabel din fereastra de rezultate se referă la informaţii despre planul de eşantionare. iar eşantionul conţi- 299 .

ne este furnizat fişierul care conţine planul de eşantionare. Pentru fiecare sta- Figura 8.Statistică aplicată în ştiinţele socio-umane ne un număr de 930 de cazuri. Summary Sample Inf ormation Selection Method Number of Units Sampled Variables Created or Modif ied Stagewise Inclusion (Selection) Probability Stagewise Cumulativ e Sample Weight Stagewise Population Size Stagewise Sample Size Stagewise Sampling Rate Stagewise Sample Weight Stage 1 Simple random sampling without replacement 930 InclusionProbability _1_ SampleWeight Cumulativ e_1_ PopulationSize_1_ SampleSize_1_ SamplingRate_1_ SampleWeight_1_ Equal probability sampling without replacement Obtained from v ariable InclusionProbability _1_ Analy sis Inf ormation Estimator Assumption Inclusion Probability Plan File: C:\Test. folosită în general la proiectarea planului de analiză a eşantionului ca variabilă caracteristică a reprezentativităţii cazurilor în eşantion.3% Următorul tabel generat se referă la sumarul stadiului. Tabelul planului de eşantionare prezintă şi o serie de date utile în proiectarea planului de analiză a eşantionului pe care-l vom discuta în următorul subcapitol. O variabilă foarte importantă la acest nivel este variabila „SampleWeight_Final_”.csplan Weight Variable: SampleWeight_Final_ Figura 8.3% 61. csplan Proport ion of Units Sampled Request ed Actual 61.14 – Planul de eşantionare Summary for Stage 1 Number of Units Sampled Request ed Actual 930 930 Plan File: C:\Test.15 – Sumarul stadiului 300 . În acest tabel regăsim informaţii despre noile variabile create în baza de date şi. de asemenea.

În cazul nostru. observăm o probabilitate de includere egală de 0. Variabila „SampleWeight” este generată automat şi corespunde oarecum frecvenţei cu care fiecare caz selectat în eşantion este reprezentat în p opulaţia generală. iar SPSS a reuşit selectarea tuturor subiecţilor (Actual). procent atins în final de către SPSS.16 – Noile variabile incluse în baza de date Trecând la baza de date. Într-adevăr. Suma acestor valori se apropie foarte mult de dimensiunea populaţiei. fiecare având valoarea 1. pe următorii şase nu i-a selectat.3%. Luând fiecare subiect în parte. următorul nefiind selectat şi aşa mai departe.61. Vom constata şi selecţia eşantionului făcută de SPSS.Cristian Opariuc-Dan diu al eşantionării va fi generat un asemenea tabel. Observăm din nou numele şi calea fişierului de tip plan de eşantionare. observăm la sfârşitul acesteia variabilele nou create. Figura 8. dintr-o populaţie de 1517 la mărimea unui eşantion de 930. Procentul solicitat a fost de 61. în care regăsim informaţii despre unităţile şi proporţiile selectate. Programul a ales în eşantion primii şapte subiecţi. a selectat apoi un subiect.63 la 301 . am solicitat includerea unui număr de 930 de cazuri în eşantion (Requested). avem 930 de cazuri.

După selectarea subiecţilor în eşantion.4. Vom folosi din nou meniul „Analyze”. apoi submeniul „Complex Samples” şi în final vom efectua click pe opţiunea „Prepare for Analysis…” Accesarea acestei comenzi determină lansarea în execuţie a unui nou asistent (Wizard). 930 × 1. specializat în proiectarea planului de analiză.17 – Meniul planului de analiză eşantionare. Prin urmare.9 valoare apropiată de mărimea populaţiei.2 Analiza eşantionului Crearea unui plan de analiză reprezintă prima etapă în studiul proprietăţilor unui eşantion. similar planului de Figura 8. Primul pas este reprezentat de specificarea fişierului în care va fi salvat planul de analiză.Statistică aplicată în ştiinţele socio-umane această variabilă. al doilea plan ca importanţă în studiul eşantionului. Opţiunea „Create a plan file” ne permite alegerea locului şi stabilirea numelui sub care va fi salvat planul de analiză. Puteţi tasta 302 . Realizarea acestuia nu oferă însă informaţii legate de caracteristicile pe care le poate avea. reprezintă o succesiune de paşi. urmând aceşti paşi. Planul de analiză. prin intermediul cărora se creează premisele studiului proprietăţilor unui eşantion. VIII. După crearea unui eşantion. urmează etapa de analiză a eşantionului în vederea identificării proprietăţilor sale statistice. este importantă analiza acestuia în vederea determinării caracteristicilor sale.63 = 1515. aţi reuşit crearea unui eşantion. Această variabilă este foarte importantă în procesul de analiză a eşantionului. Iată că.

Cristian Opariuc-Dan calea completă sau puteţi folosi butonul „Browse…”. Dacă planurile de eşantionare aveau extensia .csplan.18 – Pasul 1. Am accentuat deja asupra importanţei variabilei „Sample Weight”. Figura 8. fişierul plan de analiză se numeşte „Analiza.csaplan. Apăsarea butonului „Next” determină trecerea la următoarea etapă. În primul rând va trebui să specificăm variabila caracteristică „reprezentativităţii” eşantionului. prin intermediul căruia veţi alege locaţia acestui fişier. Evident. Observaţi diferenţa de extensie. În cazul nostru. Noua fereastră conţine mai multe elemente. Salvarea planului de analiză Opţiunea „Edit a plan file” vă permite modificarea configuraţiei unui plan de analiză salvat anterior. va trebui să furnizaţi şi un nume. planul de analiză are extensia .csaplan” şi a fost salvat direct în directorul C:\. Deşi în cazul unor eşantioane complexe 303 . tocmai în ideea de a fi familiarizaţi cu aceasta.

Variabilele cluster („Clusters”) – se include variabila care defineşte clusterii. grupuri de unităţi de observaţie în cazul în care se analizează un eşantion pe clusteri. forma finală a acesteia. forma în care SPSS ponderează de fapt toate stadiile. de obicei. caracterizează cel mai bine eşantionul.19 – Pasul 2. s-ar putea include şi alte variabile parţiale de acest tip.Statistică aplicată în ştiinţele socio-umane această variabilă poate lua diferite forme. variabilă care. 304  . Figura 8. Eşantionul total va fi reprezentat din ponderile pe care le au cazurile particulare din fiecare strat. de obicei. În cazul planurilor complexe. Stabilirea variabilelor Alte posibilităţi cuprinse la acest nivel pot fi reprezentate de:  Variabilele de stratificare („Strata”) – va fi inclusă variabila de stratificare în condiţiile unui eşantion stratificat. Vă recomand introducerea în secţiunea „Sample Weight” a variabilei de tipul „Final Sample Weight”. în planul de analiză vom include. a straturilor ori a clusterilor. dacă se doreşte investigarea la nivelul stadiilor.

Cristian Opariuc-Dan  „Stage Label” – permite definirea unei etichete a stadiului de analiză. Această metodă include corecţiile pentru populaţii finite şi pleacă de la supoziţia conform căreia unităţile au fost selectate cu o probabilitate egală. similar procesului de creare a planului de eşantionare. în care nu vor fi incluse corecţii pentru eşantioane provenite din populaţii finite la estimarea varianţei. puteţi opta pentru metoda „cu introducerea bilei în urnă” (WR). Alegerea metodei de estimare Alegerea metodei de estimare permite specificarea doar a tipului de selecţie utilizat. Figura 8. 305 . În funcţie de modul de proiectare a eşantionului . Forţarea includerii acestor corecţii se realizează prin bifarea casetei FPC care se activează la alegerea acestei opţiuni. Apăsarea butonului „Next” determină trecerea la alegerea metodei de estimare.20 – Pasul 2. Metoda „cu includerea bilei în urnă” (WOR) poate fi selectată în cazul eşantioanelor cu probabilitate egală de selecţie şi fără înlocuire.

Aceste dimensiuni pot fi fixe sau pot varia la nivelul straturilor. dar pleacă de la supoziţia că selecţia unităţilor din populaţie s-a realizat cu o probabilitate inegală.Statistică aplicată în ştiinţele socio-umane Metoda „cu includerea bilei în urnă” (WOR) şi cu probabilitate inegală foloseşte şi ea corecţiile de populaţie finită. În general. putem introduce în caseta de text „Value” cifra 1517. metoda se foloseşte în cazul unor eşantioane nealeatorii.21 – Pasul 2. Folosind caseta de derulare „Units” puteţi preciza dimensiunea exactă a populaţiei sau probabilitatea cu care elementele au fost extrase. prin urmare vom alege opţiunea a doua. În primul caz. Alegerea dimensiunii Apăsarea butonului „Next” vă permite să specificaţi probabilităţile de includere sau mărimea populaţiei la nivelul stadiului curent. Eşantionul nostru a fost creat fără „includerea bilei în urnă” şi cu o probabilitate egală. Figura 8. Această etapă este valabilă doar dacă anterior aţi ales opţiunea WOR cu probabilităţi egale. valoare ce repre- 306 .

deoarece am tratat complet problema în cadrul capitolului referitor la planul de eşantionare. prima variantă. probabilitatea de includere. care se activează numai în situaţia definirii anterioare a unei variabile de str atificare. Ultima opţiune. Utilizarea acestei secţiuni presupune o singură valoare aplicată tuturor straturilor.Cristian Opariuc-Dan zintă dimensiunea exactă a populaţiei sau 0. Sumarul planului Similar planului de eşantionare.61. ne permite includerea unei variabile numerice care conţine valorile pentru fiecare strat. „Read values from variable”. în exemplul nostru. 307 . următoarea fereastră prezintă un sumar al planului de analiză şi ne permite construirea unor noi stadii. Figura 8. Am preferat. Nu vom intra în detalii referitoare la această secţiune. Caseta care se deschide la apăsarea butonului „Define…” permite stabilirea valorilor pentru fiecare strat.22 – Pasul 2. O altă variantă o reprezintă opţiunea „Unequal values for strata”.

se poate trece la etapa finală a eşantionării. VIII. Figura 8. Deoarece Figura 8. într-un mod identic cu planul de eşantionare.24 – Analiza eşantionului nu dispunem încă de toate informaţiile necesa- 308 .Statistică aplicată în ştiinţele socio-umane Ultimul ecran ne invită să salvăm planul de analiză creat sau să copiem sintaxa într-o fereastră de comenzi SPSS. La apăsarea butonului „Finish”. iar în fereastra de rezultate va fi redată structura acestuia. Salvarea planului de analiză Un plan de analiză salvat va putea fi utilizat în vederea investigării proprietăţilor eşantionului. SPSS pune la dispoziţie mai multe metode de investigare a unui eşantion. planul de analiză va fi salvat.23 – Pasul 3.3 Investigarea proprietăţilor eşantionului Odată stabilite planul de eşantionare şi planul de analiză. şi anume investigarea proprietăţilor eşantionului.4.

vom limita expunerea doar la două proceduri ce implică statistici univariate. Procedura estimează frecvenţele eşantionului şi erorile standard. existând şi posibilitatea analizei după subgrupuri. coeficienţii de variaţie şi alte statistici utile studiului unui eşantion. Meniul „Descriptives…” produce de asemenea statistici univariate de tipul celor menţionate.25 – Alegerea planului de eşantionare 309 . determină afişarea primului ecran necesar analizei prin care urmează să alegem planul de eşantionare dorit. după cum urmează:  Meniul „Frequencies…” determină constituirea tabelelor de frecvenţe pentru variabilele selectate şi afişarea statisticilor de tip univariat.  Accesarea primului meniu. intervalele de încredere.Cristian Opariuc-Dan re studiului exhaustiv al acestor proceduri. „Frequencies…”. Figura 8.

26 – Stabilirea variabilelor de interes Va apărea. Astfel. vom putea tasta calea către planul de eşantionare sau vom putea utiliza butonul „Browse…” în vederea navigării către locaţia ce conţine acest fişier. În cazul în care probabilităţile de includere ale elementelor în eşantion nu sunt egale. specificaţii conţinute în planul de eşantionare. Trecerea la analiza efectivă se face prin apăsarea butonului „Continue”. situaţie des întâlnită în cadrul eşantionării stratificate sau al eşantionării pe clusteri. o fereastră pe care o cunoaşteţi destul de bine. utilizând secţiunea „Joint Probabilities”.Statistică aplicată în ştiinţele socio-umane Toate operaţiile din această etapă impun anumite specificaţii de analiză. iată. În secţiunea „Plan”. putem alege aceste probabilităţi dintr-o variabilă din baza de date. Figura 8. Acest ecran permite stabilirea variabilei pe care dorim să o analizăm. Se impune o 310 . caseta de text „File”. va trebui să specificăm fişierul în care s-au precizat aceste probabilităţi. dintr-o altă bază de date sau dintr-un alt tip de fişier. după cum am văzut în subcapitolul anterior.

Apăsarea acestuia determină posibilitatea stabilirii indicatorilor statistici ce vor fi calculaţi. un eşantion stratificat. dacă am fi dorit să analizăm reprezentativitatea genului biologic în funcţie de mediul de provenienţă (rural vs.Cristian Opariuc-Dan menţiune la acest nivel: variabilele folosite pot fi doar variabile categoriale.27 – Stabilirea indicatorilor statistici 311 .. situate la un nivel de măsură nominal sau ordinal. În exemplul nostru. Figura 8. Un buton deosebit de important este butonul „Statistics. Vom transfera. Lista „Frequency Tables” permite includerea variabilelor pentru care dorim să calculăm tabele de frecvenţă. în funcţie de mediul lor de provenienţă. SPSS ar fi analizat separat bărbaţii şi femeile. o listă care conţine toate variabilele din baza de date. spre exemplu. În partea stângă a ferestrei se află secţiunea „Variables”. variabilele pe care dorim să le analizăm. vom dori analiza eşantionului sub aspectul sexului (al genului biologic). prin utilizarea butonului de transfer. am fi inclus această ultimă variabilă în lista „Subpopulations”. însă. urban).. această variabilă în lista „Frequency Tables”. în condiţiile în care am realizat. Nu este cazul nostru. aşadar. Cu ale cuvinte.”. În această situaţie. Lista Subpopulations” permite includerea unei alte variabile categoriale.

Caseta „Confidence interval” permite stabilirea intervalului de încredere a estimării în baza nivelului specificat. vom calcula eroarea standard a estimării. Cu alte cuvinte. prin bifarea casetei „Population size” şi sub formă de frecvenţe relative (procente). celelalte urmând să le analizăm în volumele ulterioare. astfel:   Prin bifarea casetei „Standard error”. Coeficien312    . după cum observaţi că am procedat şi în exemplul nostru (caseta de text „Level%”).Statistică aplicată în ştiinţele socio-umane Există destul de multe opţiuni în cadrul acestei noi ferestre. Secţiunea „Cells” permite afişarea informaţiilor legate de populaţia ţintă din care a fost extras eşantionul. doar câteva. unele dintre ele fiindu-vă necunoscute. studiind aici. Caseta „Unweighted count” permite afişarea numărului de elemente folosit în realizarea estimării. Secţiunea „Statistics” permite configurarea indicatorilor statistici asociaţi dimensiunii populaţiei sau a procentului din populaţie. dimensiunea eşantionului extras. Indicatorul exprimă proporţia de varianţă a eşantionului comparată cu varianţa unui eşantion simplu randomizat. în detaliu. Noi le vom prezenta pe toate. În mod normal. sub formă de proporţii. bifând caseta „Table percent”. Vor fi afişate date referitoare la dimensiunea populaţiei sub formă de frecvenţe absolute. Caseta „Coefficient of variation” comunică programului calculul coeficientului de variaţie a estimării. intervalul de încredere îl vom stabili la 95%. deoarece nu aveţi încă informaţiile necesare referitoare la anumite teste statistice. Caseta „Design effect” permite calculul varianţei estimării.

313 . Apăsând butonul „Continue”. Cu cât valoarea este mai depărtată de unu. „Confidence interval” la un nivel de 95%. ci doar în cazul eşantioanelor mai complexe. revenim la fereastra iniţială. Fără a intra în amănunte. Caseta „Cumulative values” calculează frecvenţa cumulată a populaţiei ţintă. cu atât efectul este mai mare şi deci varianţa este mai mare. intervalul de încredere şi – doar demonstrativ – mărimea efectului şi să afişeze mărimea eşantionului (casetele „Standard error”. dacă frecvenţa bărbaţilor este semnificativ mai mare sau semnificativ mai mică în comparaţie cu frecvenţa femeilor). având aceeaşi semnificaţie ca orice frecvenţă cumulată. „Unweighted count” şi „Design effect”). Testele ne permit să verificăm dacă există diferenţe semnificative între frecvenţele categoriilor variabilei (în cazul nostru. să calculeze eroarea standard a estimării. Caseta „Test of equal cell proportions” permite calculul a două teste statistice pe care nu le-am studiat: testul χ2 şi testul de probabilitate a proporţiilor. menţionăm că ambele teste pornesc de la ipoteza nulă că toate categoriile unei variabile au frecvenţe egale.   Pentru exerciţiul nostru am comunicat programului SPSS să afişeze frecvenţa absolută şi relativă a populaţiei ţintă (casetele „Population size” şi „Table percent”).Cristian Opariuc-Dan tul nu este folosit în cazul eşantioanelor simplu randomizate – în acest caz fiind întotdeauna 1 –. fiind o măsură standard a efectului şi având acelaşi mod de interpretare.  Caseta „Square root of design effect” reprezintă rădăcina pătrată din varianţa estimării (un fel de abatere standard dacă vă mai aduceţi aminte).

Opţiunea implicită este „Use all variable data” în care vor fi analizate doar valorile valide la nivelul fiecărei variabile. Spre exemplu. 314 .28 – Tratarea cazurilor lipsă În secţiunea „Tables”. dacă analizăm variabilele „gen biologic” şi „mediu de provenienţă”. fără a fi preocupat dacă există valori valide la alte variabile.Statistică aplicată în ştiinţele socio-umane Un alt buton prezent este butonul „Missing Values”. Va trebui să existe valori la nivelul tuturor variabilelor analizate pentru ca subiectul respectiv să fie luat în considerare. chiar dacă este analizată doar variab ila „gen biologic”. va fi exclus din analiză. Un subiect care are un scor valid la „gen biologic”. Opţiunea „Use consistent case base” este însă mult mai restrictivă. putem stabili ce cazuri vor fi incluse în analiză. un subiect va trebui să aibă scoruri valide la ambele variabile. SPSS va urmări să existe valori valide doar la niv elul acestei variabile. De exemplu. Figura 8. dar nu are date la „mediul de provenienţă”. dacă analizăm variabila „gen biologic”. prin apăsarea căruia vom putea stabili modul de tratare a cazurilor lipsă.

Exprimat procentual. iar al doilea rând .000 41. ci date estimate din eşantion. Unweighted Count 406 524 930 406 524 930 Figura 8.126 692.0% 1. tabel care va conţine exact datele solicitate.3% 58.605 884. va fi afişat un tabel în fereastra de rezultate.000 .7% 45.la frecvenţele relative. în cazul variabilelor categoriale.0% 100. Respondent's Sex 95% Conf idence Interv al Lower Upper 632.0% . Aceste elemente nu reprezintă date reale.355 15.000 1. Nu putem avea un număr de 662. 1. întoarcerea la fereastra iniţială.0% St andard Error 15. Practic. În câteva fracţiuni de secundă. şi în acest caz.260 854. dacă valorile lipsă vor fi tratate ca fiind sau ca nefiind valide.Cristian Opariuc-Dan Secţiunea „Categorical design variables” determină. Lansarea efectivă a analizei datelor se face prin apăsarea butonului „OK”.0% Population Size % of Total Male Female Total Male Female Total Estimate 662. Observăm că datele noastre au fost împărţite pe cele două categorii ale variabilei de interes – bărbaţi şi femei.740 1517. Apăsarea butonului „Continue” va determina.000 1.874 1517. nu are zecimale. Primul rând se referă la frecvenţele absolute ale populaţiei ţintă. Observăm însă că dimensiunea totală a populaţiei ţintă estimate (1517 subiecţi) este egală cu populaţia ţintă reală.000 .000 43.74 femei.3% 100. A doua coloană (Estimate) exprimă frecvenţele absolute şi relative ale populaţiei ţintă.3% 100.7% 56.000 1. Un bărbat sau o femeie este un întreg.0% Design Ef f ect 1. nu este nevoie să intervenim în această fereastră decât extrem de rar şi în cazul unor planuri de eşantionare complexe.395 824.355 .26 bărbaţi şi 854. eşan315 . estimată în baza eşantionului.29 – Rezultatele analizei eşantionului Capul de tabel conţine numele variabilei de interes şi denumirea indicatorilor calculaţi.7% 54.000 1517.

35 femei (aproximativ 15 subiecţi pentru fiecare categorie.39 bărbaţi şi de la 824. Cum procedăm însă.3% femei. Coloana Design Effect are evident valoarea 1. Ultima coloană indică dimensiunea şi compoziţia eşantionului ( Unweighted Count). După cum ştiam deja.7% până la 45. eşantionul are un număr de 930 de cazuri.12 până la 692. acest lucru fiind demonstrat prin analiza efectuată. cifrele reprezentând din nou o abstracţiune).87 femei. eşantionul estimează practic o populaţie ţintă formată dintr-un număr de 632. deoarece am lucrat cu un eşantion simplu randomizat.35 bărbaţi şi 15. de exemplu vârsta? Analiza frecvenţelor nu ne ajută prea mult.Statistică aplicată în ştiinţele socio-umane tionul nostru estimează o populaţie compusă din 43. Eşantionul nostru estimează populaţia ţintă cu o eroare standard de 15. Urmează două coloane ale intervalului de încredere. ne poate determina să afirmăm că avem un eşantion reprezentativ sub aspectul sexului. Următoarea coloană (Standard Error) se referă la eroarea standard a estimării.3% până la 58. Iată că acest eşantion estimează reprezentativ populaţia ţintă la o eroare de doar 1% şi la un nivel de încredere de 95%. exprimată atât în formă brută. compoziţia populaţiei ţintă estimată de eşantion este formată din 41. Cu alte cuvinte. Undeva între aceste limite putem găsi populaţia ţintă reală estimată de eşantion. iar din punctul de vedere al sexului avem 406 bărbaţi şi 524 femei. Acest indicator devine mai clar dacă urmărim forma procentuală. care. cât şi în formă procentuală. Este timpul să 316 . cât şi în cazul femeilor.3% femei. fapt tratat mai sus. Suntem în faţa unui eşantion reprezentativ. În baza erorii standard.7% bărbaţi şi 56. dacă avem o variabilă de interes la un nivel scalar.7% bărbaţi şi 54. Iată că eroarea estimării este de 1% atât în cazul bărbaţilor. Am analizat o variabilă de interes situată la nivel nominal (sexul).60 până la 8 84. la un nivel de încredere de 95%.

pe care vom încerca să le lămurim. astfel încât nu vom insista asupra lor. variabila de interes. am ales o variabilă scalară.Cristian Opariuc-Dan abordăm cea de-a doua metodă propusă şi anume analiza descriptivă. vârsta subiecţilor.31 – Stabilirea indicatorilor statistici 317 . Figura 8.30 – Analiza variabilei de interes de tip scalar După lansarea procedeului de analiză şi alegerea planului de eşantionare prin apelarea meniului „Descriptives”. Există însă o serie de metode statistice uşor diferite. va trebui să includem. Figura 8. Apăsarea butonului „Statistics” determină apariţia unui ecran uşor diferit în comparaţie cu analiza frecvenţelor. Paşii sunt identici. În cazul nostru. similar procesului anterior.

318 . În cazul în care media p opulaţiei este cunoscută (uneori se foloseşte media teoretică).05 Mean Age of Respondent Estimate 46.33 de ani cu o eroare standard de 0.45 ani (47.05 – 45. Media reală a populaţiei se găseşte undeva între 45. cu o eroare standard mare. ci cu estimări ale mediilor.60 47. putem folosi testele „t” Student de comparaţie între media populaţiei şi media unui eşantion pentru verificarea existenţei unei diferenţe semnificative între medii.33 Standard Error . Iată că eşantionul nostru estimează o medie a populaţiei de 46.Statistică aplicată în ştiinţele socio-umane Diferenţa rezidă în secţiunea „Summaries” prin intermediul căreia putem estima mediile şi sumele variabilelor ţintă. nu mai avem de a face cu estimări ale frecvenţelor. Însuşi intervalul de încredere de 1. după cum rezultă din coeficientul de variaţie de 0. variabila analizată fiind o variabilă continuă. Celelalte opţiuni ale acestei ferestre au fost discutate şi nu este cazul să le reluăm.05 ani.008. Eşantionul este foarte omogen sub aspectul vârstei. eterogenitatea fiind în jurul valorii de 0.32 – Rezultatele analizei eşantionului În acest caz.36 ani. însă…. Într-adevăr. Este greu să vorbim despre o reprezentativitate a acestui eşantion sub aspectul vârstei su biecţilor.008 Population Size 1517.000 Unweighted Count 930 Figura 8.60) este edificator în acest sens.369 Coef f icient of Variation .8%. eşantionul de 930 de persoane estimează populaţia ţintă de 1517 persoane.60 şi 47. Executarea procedurii de analiză determină afişarea în fereastra de rezultate a unui alt tabel: Univariate Statistics 95% Conf idence Interv al Lower Upper 45. Despre aceste teste vom discuta însă în volumul următor.

Related Interests