You are on page 1of 209

Analiza Datelor

Cuprins
Introducere ......................................................................... 7 CAPITOLUL 1: Noiuni preliminare ............................... 9
1.1.Cunoaterea .............................................................................. 1.2. Cum putem defini Analiza Datelor? ....................................... 1.3. Stabilirea ipotezelor ................................................................. 1.3.1. Caracteristici ale ipotezelor ...................................... 1.3.2. Erori frecvente n formularea ipotezelor .................. 1.4. Grupul de subieci .................................................................... 1.5. Ce metode putem folosi pentru prelucrarea datelor? ............... 1.5.1. Metoda observaiei sociologice ............................... 1.5.2. Ancheta bazat pe chestionar ................................... 1.5.3. Monografia ............................................................... 1.5.4. Testele psihologice .................................................. 1.5.5. Sociometria .............................................................. 1.6. Msurarea ..........................................................

CAPITOLUL 2: Reprezentarea datelor ca mod de examinare preliminar a fenomenului studiat ............... 42


2.1. Serii de numere . 2.2. Gruparea datelor .. 2.3. Reprezentri grafice ale seriilor de numere . 2.3.1. Diagramele de tip linie . 2.3.2. Histogramele . 2.3.3. Alte tipuri de diagrame . 2.3.4. Sociograme ............................................................... 2.3.5. Alte reprezentri a datelor ........................................... 2.4. Noiuni introductive de prezentare a datelor n Power Point ...... 2.4.1. Ce este Power Point? ..................................................

2.4.2. Cum ncepem? ............................................................ 2.4.3. Cum realizm vizualizarea n Power Point? ............... 2.4.4. Modul de vizualizare Slide-Show ............................... 2.5. Graficul Gantt .. 2.6. Concluzii .....................................................................................

CAPITOLUL 3: Statistica n cercetarea social ............ 71


3.1.Caracteristici (variabile) .. 3.2 Populaie .. 3.3. Eantion. Lot. .. 3.4. Eveniment .. 3.5. Minimul i maximul 3.6. Media .. 3.7. Cuantile .. 3.7.1. Mediana 3.7.2. Cuartilele 3.7.3. Valoare modal 3.8. Indicatori ai dispersiei 3.8.1. Amplitudinea 3.8.2. Abaterea medie ( Am(a) ) 3.8.3. Variana 3.8.5. Coeficient de Omogenitate (variabilitate) 3.9. Compararea mediilor 3.9.1. Cum comparm media unui grup cu o valoare dat ... 3.9.2. Cum testm ipoteza privind diferena dintre mediile a dou grupuri cu numr redus de subieci 3.10. Testul 2 .. 3.11. Coeficientul de corelaie 3.12. Regresia liniar 3.13. Rezolvare exerciii din capitolul 3

CAPITOLUL 4: Grafuri i baze de date i ................... 147


4.1. Grafuri .. 4.1.1. Scurt istoric

4.1.2. Definiia unui graf 4.1.3. Clasificarea grafurilor 4.1.4. Arbori 4.1.5. Proprieti ale grafurilor 4.1.6. Alt posibilitate de studiu al relaiilor dintr-un grup de indivizi. 4.1.7. Reprezentarea matriceal a unui graf 4.2. Baze de date ..

Capitolul 5: Utilizarea Excel i SPSS n statistic ........ 166


5.1. Utilizarea Excel n statistic 5.1.2. Inserarea unei funcii 5.1.3. Minim i maxim dintr-un ir de date 5.1.4. Media 5.1.5. Mediana 5.1.6. Amplitudinea 5.1.7. Coeficientul de omogenitate 5.1.8. Compararea mediei unui grup cu o valoare dat ..... 5.1.9. Testul t 5.1.10.Testul 2 5.1.11. Coeficientul de corelaie 5.1.12. Regresia liniar 5.1.13. Tabel funcii excel pentru calcule statistice ........ 5.2. Utilizarea SPSS ......................................................................... 5.2.1. Ferestre i fiiere n SPSS . 5.2.2. Introducerea datelor 5.2.3. Crearea unui fiier de date 5.2.4. Statistica descriptiv a bazei de date 5.2.5. Corelaia 5.2.6. Comparaia ntre mediile a dou loturi 5.2.7. Testul 2 (hi-ptrat) 5.2.8. Coeficientul alpha 5.3. Concluzii ..

Introducere

Acest curs reprezint o ncercare sintez a unor studii realizate pn n acest moment n domeniul analizei datelor. n principal am urmrit sistematizarea unor informaii care s ajute studentul n nelegerea i realizarea unui proiect de diplom ca un prim pas n realizarea cercetrii tiinifice. n general, pentru studenii de la tiinele sociale este destul de complicat nsuirea unor noiuni ce au un caracter mai tehnic. Aceasta se datoreaz anumitor abordri defectuoase a materiilor tehnice. Nu odat s-a ntmplat la cursul de analiza datelor ca o singur formul pus pe tabl s creeze o reacie negativ din partea studenilor. De aceea vom ncerca o abordare mai uman a acestei materii, pornind de la experienele pe care le-am avut n decursul anilor de predare. Lucrarea este structurat pe 5 capitole. Succesiunea capitolelor a fost impus de dorina de a grada prezentarea de la uor la noiuni mai dificile, pentru a face mai accesibil parcurgerea crii. n primul capitol parte se d definiia disciplinei de Analiza Datelor i rolul i locul ei n cercetarea sociologic i psihologic. Apoi se prezint o parte din etapele realizrii unui proiect de cercetare. A doua parte reia anumite noiuni de la Informatica aplicat n sociologie i psihologie, legate de prezentarea datelor: realizarea de diagrame, de scheme i ceva noiuni despre Microsoft Power Point.

n capitolul trei se prezint intuitiv cteva din instrumentele statistice utilizabile n cercetare. Desigur nu este vorba de o analiz n profunzime deoarece noiunile sunt prezentate n cursul de statistic. De altfel pentru o nelegere mai bun recomandm consultarea i a materialelor predate n cursul de statistic. n capitolul 4 se prezint instrumente de stocare a rezultatelor, adic noiuni despre baze de date i grafuri, noiuni ce vor fi utile prezentrii de SPSS-ului i a Excel-ului. Odat reamintite noiunile de statistic se va trece la capitolul cinci n care se vor prezenta noiuni de realizare a calculelor statistice cu ajutorul SPSS-ului i a Excel-ului. Se consider cunoscute, i deci nu se vor mai relua, noiuni de utilizarea computerului, noiuni de metode i tehnici de cercetare social (dei o parte din acestea se vor relua pe scurt).

Capitolul 1: Noiuni preliminare

1.1. Cunoaterea

Ce ar putea determina pe cineva s citeasc o carte? S deschid cartea i s vad ce poate fi scris n paginile ei? Curiozitatea au rspuns mare parte din studeni cnd le-am pus aceast ntrebare. Curiozitatea este o manifestare a unei ntrebri pe care ne-o punem: putem gsi ceva aici? Putem cunoate ceva? Deci curiozitatea ar putea fi o manifestare a dorinei de cunoatere. Cunoaterea este motorul care ne duce n fiecare zi dintr-o parte n alta. Vrem s tim cum va fi vremea, deschidem radioul i ateptm s vin tirile despre vreme. Vedem un meci la televizor, apoi a doua zi cumprm ziarul ca s vedem, s cunoatem i cum au vzut alii, sau poate ce au vzut alii i noi n-am vzut la acel meci. Deci faptul c ceva s-a ntmplat nu e suficient, dorina noastr este de a analiza de a obine ct mai multe date despre ceea ce ne intereseaz. Totui din multitudinea de lucruri care se ntmpl n jurul nostru cum alegem pe unele i respingem pe altele? Cum alegem s cunoatem unele i s nu cunoatem altele? n cartea ei1, Ruane determin mai multe ci de cunoatere: Cunoaterea tradiional Cunoaterea dat de autoriti Cunoaterea dat de bunul-sim

Cunoaterea dat de intuiie Cunoaterea realizat prin metode tiinifice Faptul c dintre cele cinci tipuri de cunoatere cea mai ndeprtat de subiectivism este cunoaterea realizat prin metode tiinifice, d o motivaie acestei cri. Specificm totui c nu trebuie respinse celelalte tipuri de cunoatere, dar acestea nu constituie subiectul manualului de fa.

1.2. Cum putem defini Analiza Datelor?


n cele ce urmeaz vom prezenta dou posibile definiii ale analizei datelor. O prim prezentare ne bazm pe definirea succesiv a unor concepte, construcia finalizndu-se cu definirea analizei datelor. La baza analizei datelor sta conceptul de mesaj. Mesajul reprezint baza comunicrii, voluntare sau involuntare, ntre un emitor i un receptor. Ceea ce accept un receptor se numesc date. Atragem atenia asupra faptului c nu ceea dorete s transmit emitorul se numesc date, deoarece o parte din ceea ce se transmite se poate pierde pe drumul ntre emitor i receptor. Contientizarea prin analizare i prelucrare a datelor receptate transform datele n informaie. Deci o posibil definiie a analizei datelor ar fi: Procesul prin care datele primite de receptor se transform n informaie. Schematic aceasta se poate reprezenta astfel:

Date culese din teren

Analiza i prelucrarea

Informaii

Fig.1 Trecerea de la date la informaii cu ajutorul Analizei Datelor

Informaiile odat dobndite devin parte a cunotinelor. De aceea, putem spune c finalizarea analizei i prelucrrii datelor este de a transforma datele n informaii, iar informaiile s ajute la formarea de cunotine. Ce se nelege prin cunotine? Cunotinele sunt elemente abstracte i individuale despre obiectele din lumea real, nsuite prin educaie i experien.2 Am insistat pe o prezentare n detaliu a acestor noiuni pentru c ele reiau pe scurt unele din principiile oricrei cercetri. Exemplul 1 Acum civa ani, un student m-a rugat s-l ajut s fac o repetiie pentru susinerea proiectului de

diplom. Era vorba de un studiu comparativ privitor la relaia dintre mam i copil ntre mamele care aveam program de 8 ore la serviciu i cele care aveau program de 4 ore. A nceput s vorbeasc despre tema pe care i-o alese la proiect. A prezentat obiectivele, ipotezele, instrumentele de lucru, chiar i nite diagrame destul de sugestive. n final, a vzut c ntre cele dou loturi avea diferene semnificative. Ce prere avei? m-a ntrebat. Nici una pentru c nc nu ai terminat, i-am spus. Ceea ce mi-ai prezentat pn aici sunt doar nite date cu o prelucrare preliminar Relund prin prisma conceptelor prezentate exemplul de mai sus vom spune c studentul este un receptor al unor date culese din teren, prin prelucrarea primar a datelor el a transformat datele n informaie, dar informaia dei corect, ntre cele dou loturi erau diferene semnificative, totui era insuficient pentru a fi parte integrant a unor cunotine despre fenomenul studiat. Cea de-a doua metod pornete de la definiia din dicionar a celor dou cuvinte care compune sintagma Analiza Datelor. Conform dicionarului explicativ al limbii romne pentru a analiza gsim

urmtoarea definiie:
ANALIZ, analizez, vb. I. Tranz. 1. A cerceta un ntreg, un fenomen etc., examinnd fiecare element n parte. A

10

examina un text din diferite puncte de vedere. sau ANALIZ vb. 1. a cerceta, a examina, a investiga, a studia, a urmri, (livr.) a considera, (nv.) a medita, a privi, a socoti, (fig.) a explora, (nv. fig.) a scrmna. (~ cauzele unui fenomen.) 2. v. examina. 3. a comenta, a explica, a interpreta, a tlcui, (nv.) a ntoarce, (fig.) a descifra. (~ un text literar.)

S lum pe rnd elementele ce apar n aceast definiie: O cercetare pornete de la un fenomen, de la un ntreg care ne atrage atenia i prima reacie este s privim fiecare detaliu al lucrului analizat, adic s examinm fiecare element n parte. Cercetarea poate porni de la un text la care mai nti ne informm asupra diferitelor puncte de vedere asupra textului, urmnd ca s ncercm un punct de vedere diferit. Tot n dicionarul explicativ pentru date gsim urmtoarea

definiie
DAT2, -, dai, -te, adj., s.f. I. Adj. Pus la dispoziie, oferit; nmnat, transmis, prezentat, druit. Expr. La un moment dat = ntr-un anumit moment; n clipa aceea. n cazul dat = n acest caz, n cazul de fa. Dat fiind (c...) = innd seama de... (sau c...), avnd n vedere (c...); deoarece. [] Dat uitrii = uitat, prsit. II. S.f. 1. Momentul, mprejurarea (repetabil) cnd se produce un fapt; oar, rnd. Loc. adv. Data trecut = cu prilejul anterior. Data viitoare = ntr-o mprejurare ulterioar. De data aceasta (sau asta) ori de ast dat = de rndul acesta, acum. Pe dat ce... (sau cum...) = ndat; pe loc, numaidect. O dat = ntr-un singur caz. Nu o dat = de multe ori. nc o dat = din nou. 2. (La pl.) Fapte stabilite (de tiin), elemente care constituie punctul de plecare n cercetarea unei probleme, n luarea unei hotrri etc. III. S.f. (Reg.) Soart, destin. Cum (sau precum) e data = dup cum e obiceiul, datina. V. da2.

11

Pornind de la aceste dou definiii putem spune c Analiza Datelor este disciplina care se ocup cu cercetarea, examinarea, investigarea, interpretarea faptelor stabilite tiinific, fapte unei hotrri. Deci cu alte cuvinte putem spune c analiza datelor reprezint o etap n cercetarea tiinific a unui fenomen. n continuare vom discuta despre etapele cercetrii. Acestea sunt: 1. Proiectarea 2. Fixarea obiectivelor, stabilirea ipotezelor 3. Selecia grupului/grupurilor de subieci 4. Alegerea metodelor ce urmeaz s fie folosite n culegerea i prelucrarea datelor (att a instrumentelor specifice ct i a celor statistice) 5. Alegerea lotului de subieci (n cazul sondajelor de opinie este vorba de designul eantionului reprezentativ) 6. Analiza Datelor 7. Diseminarea rezultatelor (prezentarea proiectului de licen n faa comisiei de examinare n cazul absolvenilor, prezentarea rezultatelor finanatorului, publicarea rezultatelor n reviste de specialitate etc.) Toate aceste etape ale cercetrii sunt importante deoarece orice eroare n gestionarea lor poate duce la erori destul de mari n analizarea datelor. care constituie punctul de plecare n cercetarea unei probleme, n luarea

12

Proiectul de diplom reprezint o prim ocazie pentru student de a fi pus n situaia unei cercetri pe care trebuie s-o realizeze i s-o prezinte singur n faa unei comisii de examinare. De aceea considerm c este util, n vederea pregtirii proiectului, s prezentm cteva noiuni de management de proiect. De cele mai multe ori studenii pornesc la realizarea cercetrii ce va sta la baza proiectului de diplom construiesc aceast cercetare fr a-i planifica timpul sau resursele ceea ce are ca efect de cele mai multe ori faptul c ajung n criz de timp. Ce nseamn a realiza un proiect? Un proiect reprezint [] un grup de activiti relaionate n mod organizat pentru ndeplinirea unui scop3. n realizarea oricrui proiect trebuie s avem n vedere trei constrngeri principale4: timp (durata efectiv de realizare a cercetrii) resurse (materiale, financiare, etc.) specificitate a rezultatelor.

De aceea, ar fi bine ca studenii s in cont de aceste trei constrngeri cnd i planific activitile legate de realizarea unui proiect. Planificarea activitilor se realizeaz n etape sau subetape pentru procesele mai complicate. Atunci cnd proiectm aceste etape exist dou moduri de abordare:

1. planificarea direct de la prima etap la etapa final


(aceasta nsemnnd o cunoatere foarte bun a tehnicilor cercetrii)

13

2. planificarea invers5 pornim dinspre etapa final spre


prima etap (n acest caz este necesar s vizualizm foarte bine etapele pentru a gsi drumul optim dintre ultima i prima etap).6 Un nou mod de abordare a proiectrii unei cercetri este cel realizat cu ajutorul tehnicii de programare n reea. Din aceste tehnici amintim: graficul Gantt graficul PERT7 graficul CPM8

La finalul capitolului 2 vom prezenta cteva noiuni legate de graficul Gantt. n finalul acestei seciuni revenim la problema gestionrii timpului. Kerzner n d o list a activitilor ce pot rpi timp n realizarea unui proiect9. Din acestea amintim: munca incomplet amnarea nejustificat n luarea unor decizii folosirea exagerat a telefonului, chat-ului, etc. ntrzierile la ntlniri corectarea superficial a unor erori planificarea pe termen scurt (lipsa unei planificri pe termen lung) perfecionismul schimbri dese ale planificrii

analizele pe prea multe niveluri 14

1.3. Stabilirea ipotezelor


Odat aleas tema i stabilite obiectivele, problema ce trebuie rezolvat este cea a stabilirii ipotezelor. Atunci cnd se stabilesc ipotezele trebuie avute n vedere dou repere de baz: fiecare ipotez s provin dintr-un obiectiv, i n acelai timp s fie n acord cu instrumentele utilizate. Un alt aspect definitoriu al ipotezelor l reprezint faptul c ipotezele presupun o solid informaie n domeniu, care ofer i cadrul conceptual al ipotezei10.

1.3.1. Caracteristici ale ipotezelor


I. Radu prezint anumite caracteristici ale ipotezelor. Din acestea amintim11: Explic un ansamblu de date

Ipoteza trebuie s fie bine ntemeiat, plauzibil sau


verosimil Ipotezele trebuie s fie verificabile

1.3.2. Erori frecvente n formularea ipotezelor


n cele ce urmeaz vom prezenta cteva din erorile ntlnite n formularea unor ipoteze: 1. Exprimarea mult prea general a ipotezei

15

Exemplul 2: Hiperemotivitatea conduce la anxietate ridicat i depresie.

2. folosirea gradelor de comparaie fr a spune nimic (sau a folosi o exprimare neclar) privitoare la termenii ce se vor compara Exemplul 3: exist o alegere din partea angajailor, ncepnd de la un anumit nivel al salariului , ntre sporirea numrului de ore lucrate i sporirea timpului liber 3. formularea prin negare Exemplul 4 succesul colar nu are drept determinant principal inteligenta peste medie

4. folosirea de adjective necuantificabile Exemplul 5 copiii expui n mai mare msur la pericolul de a fi supui unor rele tratamente, se regsesc n special n familiile cu situaie material precar 5. folosirea de cuvinte-balast Exemplul 6 indiferent de tipul de abuz suferit, copiii-victime prezint totui un tablou, simptomatologic comun:

16

relaionarea defectuoas, scderea randamentului colar (eventual abandon colar), stare agresiv i comportamente agresive 6. exprimarea de concluzii Exemplul 7 Cu ct Biserica va blama homosexualitatea, cu att atitudinea romnilor va fi mai negativ (Romnia este o ar unde sentimentul religios este foarte puternic, iar Cuvntul Bisericii are un rol decisiv)

Desigur acestea sunt doar o parte din erorile frecvente n formularea ipotezelor, dar am inut s atragem atenia asupra lor deoarece formularea unei ipoteze reprezint unul din paii cei mai importani ai cercetrii. O alt problem legat de ipoteze o reprezint clieul confirmrii ipotezei de start12. Aceasta se refer la faptul c de multe ori, mai ales la cei care sunt la nceputul activitii de cercetare, exist tendina ca lucrarea s se axeze pe confirmarea cu orice pre a ipotezei de start, ignorndu-se discordanele cu aceasta. Exemplul 8 S-a aplicat o sociogram ntr-o clas. n urma aplicrii sociogramei s-a determinat liderul. Analiznd ns rezultatele s-a observat faptul c doi elevi din clas, dei ei i-au exprimat opiniile, nu au primit nici un punct de la colegi. Ceea ce ar putea duce la anumite ntrebri privind integrarea lor n grup. Deci pe lng ipoteza de start se poate aduga, n aceast situaie, i un studiu de caz pentru cei doi

17

elevi.

1.4. Grupul de subieci


Am folosit sintagma grupul de subieci deoarece cele ce urmeaz sunt valabile att pentru eantion ct i pentru lot. n principal n aceast seciune ne vom ocupa de experimentele comparative. Pentru a realiza un astfel de studiu, trebuie s alegem un grup de control i un grup experimental. Grupul de control este acel grup care nu este supus stimulilor specifici experimentului este un grup care propriu-zis nu intervine in experiment. De unde i denumirea de grup de martor. Exemplul 9 S-a realizat o cercetare n care s-a pus problema dac relaxarea, ca tehnic psihoterapeutic, conduce la ameliorarea simptomelor nevrotice. Pentru aceasta s-a luat ca grup experimental 30 de pacieni, din care 15 brbai i 15 femei. Acetia au fost selecionai n mod aleator dintre persoanele cu tulburri anxioase ce s-au prezentat la clinic, solicitnd psihoterapie. Grupul martor conine 30 de persoane selectate n mod aleator, dintre care 15 brbai i 15 femei care prezentau acelai tip de tulburri anxioase ca i cei din grupul experimental. Se poate observa c puteam s lucrm cu un singur grup de subieci unde, nainte de a i se aplica tehnicile psihoterapeutice, era grupul martor i dup aplicarea tehnicilor terapeutice devine grup experimental.

18

Atunci cnd efectum msurtori asupra unui grup trebuie s inem seama de o serie de factori13 cum ar fi:

Efectul de maturare diferenele ce ar putea aprea ntre


dou msurtori s nu se datoreze stimulilor aplicai n cadrul experimentului, ci maturrii ce a avut loc pe parcursul experimentului Exemplul 10 La clasa a treia se dorete s se studieze dac prin folosirea unor tehnici de dezvoltare a ateniei elevii se descurc mai bine la efectuarea calculelor de nmulire. Dup un semestru se compar rezultatele de la nceputul anului cu cele de la sfritul semestrului. Se observ c majoritatea elevilor au obinut scoruri mai bune. n acest caz ns nu putem folosi ca grup martor grupul de la nceput i ca grup experimental grupul la sfritul semestrului, deoarece nu putem ti dac evoluia pozitiv se datoreaz metodei aplicate sau faptului c elevii n timp, lucrnd la matematic oricum i-ar fi mbuntit performanele. n acest caz se recomand folosirea a dou grupuri distincte: un grup de elevi crora li se aplic tehnicile de dezvoltare a ateniei grup experimental i un grup de elevi crora nu li s-a aplicat nici o tehnic de dezvoltare a ateniei grup martor. Comparaia se va face ntre aceste grupuri att la nceputul semestrului ct i la sfritul semestrului. Grupurile trebuie alese la nceputul semestrului astfel nct s nu fie diferene semnificative ntre ele, iar la sfrit eventuala apariie a unei diferene ne poate aduce informaii despre efectele tehnicilor de dezvoltare a memoriei asupra copiilor.

19

Efectul testrii repetate aplicnd la intervale destul de


scurte acelai test de mai multe ori pe acelai lot de subieci rezultatele vor fi influenate i de faptul c subiecii ajung s cunoasc foarte bine testul Exemplul 11 msurm anxietatea zilnic, timp de o sptmn nainte de operaie, la pacienii din acelai salon. Diferenele care ar putea aprea n acest caz se pot datora i faptului c pacienii se obinuiesc cu testul i dau alte rspunsuri pentru a nu se repeta.

Influena evenimentelor externe apariia unui eveniment


extern experimentului, eveniment ce poate influena subiecii. Exemplul 12 Se aplic un chestionar pe problema corupiei n mediul urban i n mediul rural. n prima zi se aplic n mediul rural. Seara la televizor la tiri se vorbete despre un proces n care exist acuzaia de corupie a unui demnitar. Diferenele ce ar putea aprea a doua zi la aplicarea chestionarului n mediul urban se pot datora i influenei emisiunii din seara de dinaintea aplicrii chestionarului

Corectitudinea seleciei subiecilor selecia subiecilor


trebuie s se realizeze pe ct posibil independent de voina subiecilor i trebuie evitat subiectivismul celui care face selecia

20

Exemplul 13 ntr-o coal s-a aplicat un test de anxietate doar la elevii ce s-au oferit voluntari n a completa testul. Sau obinut valori sczute ale anxietii. Totui nu putem realiza o interpretare a datelor deoarece nu tim dac acest valori sczute se reprezint realitatea sau faptul c lotul a fost compus din elevi ce s-au oferit voluntari a dus la valori sczute ale anxietii. Exemplul 14 S-a aplicat un chestionar n care se studia interesul populaiei dintr-un ora fa de problemele din nvmnt. Chestionarul a fost aplicat n curtea unei coli printre prinii ce ateptau copiii de la clasele primare s ias de la cursuri. Rezultatele acestui chestionar nu pot fi validate, deoarece ceea ce s-a obinut n urma prelucrrii nu se poate spune dac este rspunsul populaiei fa de ntrebrile puse sau e vorba de influena faptului c s-a aplicat printre prinii elevilor din ciclul primar

Riscul de a pierde subieci14 din cauza unor condiii ce


nu depind de subiect se poate ca o mare parte din subieci s nu rspund la toate ntrebrile. Exemplul 15 Se dorete s se vad impactul unui film asupra spectatorilor. Se aplic la o grdin unde ruleaz acel film. Se aplic un chestionar nainte de a rula filmul, urmnd ca la final s se mai aplice chestionarul nc odat. Pe la mijlocul filmului ns ncepe ploaia i toi spectatorii au plecat n grab astfel nct operatorul nu a mai apucat s aplice i a doua oar chestionarul

21

Desigur exist mai multe aspecte care trebuiesc urmrite atunci cnd se selecteaz un grup n vederea realizrii unui experiment. Am prezentat doar situaiile cele mai des ntlnite. Pentru a vedea i alte cazuri recomandm, de exemplu, consultarea [Rad].

1.5. Ce metode putem folosi pentru prelucrarea datelor?


n aceast seciune dorim s realizm o trecere sumar n revist a principalelor instrumente ce se folosesc n prelucrarea datelor, altele dect cele statistice15. Chiar cu riscul de a fi considerai negativiti la metodele clasice de cercetare vom ncepe cu prezentarea neajunsurilor i apoi a avantajelor. Alegem aceasta deoarece de cele mai multe ori, n utilizarea metodelor, studenii se concentreaz pe avantajele acelui instrument, ignornd dezavantajele ce le pot aprea chiar i n condiiile folosirii corecte a instrumentului.

1.5.1. Metoda observaiei sociologice


Una din metodele de baz n sociologie o constituie observaia. Avnd n vedere c aceast metod se afl la grania dintre intuiie i raionament, folosirea ei trebuie realizat cu foarte mare grij. n primul rnd, fr o susinere din partea altor metode i instrumente, observaia poate deveni surs de eroare n analiza datelor. Dintre alte neajunsuri ale acestei metode amintim:

22

necesit timp ndelungat de folosire

se folosete pe eantioane16 mici


la nivel de observaie nu se recomand ncercarea de a identifica relaii cauzale i atunci apare ntrebarea: De ce s se foloseasc aceast metod? n primul rnd aceast metod este util atunci cnd e folosit mpreun cu alte metode. Printre avantajele acestei metode avem: permite accesul direct i nemijlocit al cercettorului la realitatea social asigur un grad mare de obiectivitate i complexitate a imaginii rezultate ne ajut s nregistrm fenomenul studiat n condiiile sale proprii de desfurare

poate

realiza

att

nregistrarea

comportamentelor

individuale ct i a celor colective Putem distinge dou mari tipuri de observaie: Un prim mare tip de observaie l constituie observaia spontan. Aceasta reprezint genul de observaie realizat la nivelul al simplului contact al cercettorului cu realitatea. Dintre dezavantajele acestui gen de observaie am aminti: se realizeaz n general pe o baz subiectiv, rareori se poate repeta n aceleai condiii nregistrarea se face pe baza memoriei deci exist pericolului trunchierii informaiilor

23

Ca avantaje: acest gen de observaie este foarte util pentru a gsi direcii noi de cercetare, de a cuta noi soluii n probleme la care s-a ajuns n impas. Unul din exemplele clasice este descoperirea penicilinei de ctre Flemming. Totui continund analogia, fr trecerea la observaia tiinific, observaia spontan care i-a atras atenia lui Flemming ar fi avut rezultate neconcludente17. Despre observaia tiinific Henri H. Stahl18 atrgea atenia asupra urmtoarelor note definitorii: [] are la baz o concepie tiinific despre lumea nconjurtoare [] vizeaz totalitatea aspectelor fenomenului studiat [] este condus dup anumite reguli [] asigur un grad mare de obiectivitate n aprecierea fenomenelor [] procedeaz la descompunerea obiectului observat n elementele lui componente i apoi trece la evidenierea ntregului datele i informaiile rezultate n urma observaiei sunt nregistrate ntr-o fi de observaie, n vederea prelungirii lor ulterioare Totui trebuie remarcat c observaia tiinific devine mult mai bogat n rezultate atunci cnd este o urmare a unei observaii spontane. Desigur acesta nu este singurul mod de a clasifica observaiile. Am putea aminti c observaiile se pot clasifica dup gradul de

24

structurare, dup gradul de implicare al cercettorului n sistemul studiat, n funcie de durata observaiei, natura observaiei, gradul de extensiune i de profunzime al observaiei19. Acestea sunt tratate pe larg n manualele de specialitate din care putem s recomandm [Cau]. Pentru a fi siguri c folosim corect metoda observaiei sociologice trebuie s ne facem nite reguli pe care s le respectm. Desigur nu exist reguli general valabile, dar dac s-ar ncerca gsirea unor elemente comune un punct de plecare ar fi aprecierile lui T. Calpow20: observaia trebuie s aib la baz o foarte bun pregtire teoretic a observatorului formularea cu precizie a tehnicilor de observare i a procedeelor de notare a observaiilor notarea faptelor de observaie, pe ct posibil la faa locului, pe teren trebuie realizat distincia dintre faptele observate i prerile observatorului n sensul c acestea trebuie notate separat observarea trebuie s se realizeze continuu i sistematic, avndu-se n vedere urmrirea obiectivelor precis formulate. Odat luate aceste precauii prin folosirea metodei observaiei sociologice putem ajunge la cunoaterea i nelegerea realitii, ct i la explicarea celor observate.

25

1.5.2. Ancheta bazat pe chestionar


Atunci cnd dorim s explicm comportamentele umane i s identificm factorii ce determin aceste comportamente, un instrument foarte util l reprezint chestionarul. Atunci cnd se aplic un chestionar exist mai muli factori care pot influena rspunsurile. Dintre acetia amintim: personalitatea celui care ancheteaz, personalitatea celui anchetat, tema anchetei, locul unde se aplic chestionarul, timpul de desfurare al chestionarului. Chestionarul reprezint un instrument al unui tip de anchet. De aceea acest tip de anchet mai poart i denumirea de anchet prin chestionar. Dintre caracteristicile anchetei prin chestionar am aminti: 1. Caracterul standardizat - numrul ntrebrilor, ordinea ntrebrilor i forma lor este stabilit clar dinainte. Tot cadrul standardizat al anchetei este asigurat de faptul c se stabilete dinainte numrul persoanelor alocate fiecrei caracteristici21 acest numr rmnnd neschimbat pe tot parcursul anchetei. 2. Tehnici specifice instrumentului folosit (chestionarului) 3. Numrul mare de persoane pe care se aplic chestionarul ancheta de chestionar, pentru a fi corect realizat, trebuie aplicat pe eantioane22 mari, existnd o legtur strns ntre numrul de persoane pe care se aplic chestionarul i nivelul de semnificabilitate al rezultatelor. Chestionarele se pot clasifica n funcie de trei criterii23:

26

coninutul informaiilor obinute o o o o o o o o o o chestionarele de date factuale chestionarele de opinie chestionarele speciale chestionarele tip omnibus chestionare cu ntrebri nchise chestionare cu ntrebri deschise chestionare cu ntrebri mixte chestionare cu ntrebri scalate chestionare autoadministrate chestionare administrate de ctre operatorii de anchet Exemplu 16 Atunci cnd a avut de aplicat un chestionar, studentul a realizat un presondaj unde printre alte ntrebri a pus si ntrebarea deschis: Cum vi se par condiiile de la locul dumneavoastr de munc? Dup centralizarea rezultatelor, dei sperase ca la aceast ntrebare s poat determina anumite opiuni pentru a face o interpretare, paleta de rspunsuri era foarte larg. Atunci, deoarece i-a dat seama c exist riscul ca n cazul n care ar lsa ntrebarea deschis interpretarea s fie mai greu de realizat, iar rspunsurile primite destul de greu de cuantificat, studentul a optat pentru transformarea acestei ntrebri ntr-o ntrebare nchis de forma:

forma ntrebrilor

modul de aplicare al chestionarelor

27

Ct de mulumit suntei de condiiile de la locul dumneavoastr de munc? a. mulumit b. nici mulumit , nici nemulumit c. nemulumit n general chestionarul se administreaz prin intermediul operatorilor pe teren. Desigur mai exist i alte moduri de aplicare a unui chestionar, cum ar fi: telefonic, prin scrisori, sau cu ajutorul Internet-ului (prin email, chat sau chiar pagini specializate n aplicarea electronic a rspunsului), dar acestea sunt mai puin utilizate n comparaie cu metoda clasic prin intermediul operatorilor de teren. Elementul de baz al unui chestionar l constituie ntrebarea. Cnd analizm o ntrebare exist cel puin trei elemente importante la care facem referire: coninutul ntrebrii, o o o ntrebri factuale ntrebri de cunotine ntrebri e motivaie

forma ntrebrii24,
poziia ntrebrii n cadrul chestionarului o o ntrebri introductive ntrebri de coninut

o ntrebri de trecere
o o o ntrebrile filtru ntrebrile bifurcate ntrebrile de control

28

ntrebri de identificare

n cele expuse pn aici ne-am referit la chestionare doar din punct de vedere al componentelor acestora. Dar ceea ce face un instrument s funcioneze este raportul ce se stabilete ntre diferitele pri ale instrumentului. Aceste raporturi, conduc la evidenierea tehnicilor conform crora se pot alctui chestionarele25. Dintre tehnicile de alctuire a chestionarelor amintim: tehnica plniei trecerea de la general la particular i tehnica plniei rsturnate trecerea se face de la particular la general. Exemplul 17 (tehnica plniei) 1. Cum credei c se triete n Romnia comparativ cu acum un an? 2. Cum credei c trii dumneavoastr comparativ cu acum un an? Exemplul 18 (tehnica plniei rsturnate) 1. n situaii critice v folosii de autoritatea dumneavoastr de manager pentru a soluiona o problem? 2. Cnd ar trebui un manager s se foloseasc de autoritatea dat de poziia lui n cadrul firmei? Atunci cnd stabilim ntrebrile i structura chestionarului trebuie s avem n vedere posibile pericole ce pot aprea n gestionarea acestui instrument. Din acestea am aminti:

29

I. Atunci cnd ntr-un chestionar, datorit aezrii ntrebrilor, avem contaminarea rspunsurilor spunem c se manifest efectul de halo.

Exemplul 19
1.Credei c majoritatea politicienilor sunt corupi? a. Da b. Nu c. Nu tiu 2.Considerai c n sistemul sanitar exist corupie? d. Da e. Nu f. Nu tiu 3. Se poate vorbi de corupie n sistemul juridic? g. Da h. Nu i. Nu tiu 4.Ct de mare considerai c este corupia n Romnia? j. Foarte mare k. Mare l. Medie m. Mic n. Foarte mic II. Un alt posibil factor de eroare n utilizarea unui chestionar este lungimea chestionarului. S.Chelcea , de exemplu, recomand un numr de 25 pn la 50 de itemi26. Numrul de ntrebri ce pot fi puse ntr-un chestionar reprezint totui o opiune a celui care alctuiete chestionarul.

30

III. O eroare destul de mare o constituie erorile de eantionare care se pot manifesta sub mai multe forme. Dintre acestea amintim: Nerespectarea unor caracteristici ale populaiei de baz Numrul prea mare de refuzuri IV. Un alt tip de erori l reprezint erorile datorate operatorilor de teren. Acestea pot fi: Personalitatea necorespunztoare a operatorilor (datorat unei selecii incorecte a operatorilor) arogan, aspect fizic neplcut, neseriozitate, etc. Aplicarea incorect a chestionarului scurtarea ntrebrilor, simplificarea excesiv a ntrebrii, schimbarea ordinii ntrebrilor, etc.

Influenarea respondenilor de ctre operatori pentru a


da anumite rspunsuri Nerespectarea eantionrii sau a pasului de aplicare a chestionarului V. O surs de erori, deloc neglijabil, o constituie cei care dau rspunsurile. Dintre acestea am aminti:

Nesinceritatea rspunsurilor
Refuzul de a completa sau de a participa Sensibilitatea subiecilor la anumite teme Tendina de a da rspunsuri conforme cu ceea ce este de dorit din punct de vedere social Tendina de a se pune ntr-o lumin favorabil

31

Dei aceste erori expuse mai sus sunt destul de frecvente, ancheta pe baz de chestionar rmne un instrument important n cercetrile sociale i utilizat cu atenie pentru a evita erorile expuse mai sus poate constitui o importanta surs de date.

1.5.3. Monografia

1.5.4. Testele psihologice


Deoarece acest manual se adreseaz studenilor ce sunt abia la nceputul activitii de cercetare, ne vom referi la teste, doar din punctul de vedere al utilizatorilor testelor27. O prim problem ce trebuie rezolvat atunci cnd se dorete folosirea unui test ntr-o cercetare este de a gsi testul potrivit

32

subiectului studiat. Alegerea testului nu trebuie s se bazeze doar pe denumirea testului. Aceasta deoarece, aa cum remarca I.Radu28: (...) numele (...)spune puin (...) el caut s ascund obiectivul sau intenia testului pentru a evita rspunsul conformist ori favorabil (din partea subiectului). De aceea, recomandm ca naintea aplicrii unui test s se parcurg cu atenie manualul testului sau materialul de ndrumare ce nsoete testul. Din cele expuse mai sus mai apare i un alt aspect al aplicrii unui test. Cu ct subiectul cruia i aplicm testul tie mai puine despre test cu att rezultatele vor fi mai aproape de adevr.

1.5.5. Sociometria
Sociometria ca metod a fost folosit pentru prima oar ntr-un studiu realizat de Moreno n 1934 n Statele Unite n lagre de persoane deportate i ntr-o instituie pentru tineri delicveni. La baza acestei metode e un chestionar ce cuprinde dou ntrebri care evideniaz alegerea respectiv respingerea ntr-un grup n raport cu o anumit activitate. ntrebrile pot fi de genul: pentru alegere: pe cine ai alege s faci activitatea propus pentru respingere: care ar fi persoana cu care ai dori cel mai mult s nu faci activitatea propus Bineneles c ntrebrile pot suferi mici variaii, dar astfel nct s se pstreze sensul de alegere respectiv respingere. n 1952 Tagiuri29 propune ca la aceste dou ntrebri s se adauge nc dou care s se

33

refere la cine crede cel chestionat c l-ar fi ales i cine crede cel chestionat c l-ar fi respins. Pentru a avea asigurat validitatea rspunsurilor trebui s respectm urmtoarele reguli30: grupul studiat trebuie s aib o perioad semnificativ de lung de convieuire trebuie s avem acordul membrilor grupului, s nu fie impus faptul de a rspunde la ntrebri. asigurarea confidenialitii rspunsurilor trebuie s fie explicitate criteriile alegerii chestionarul trebuie aplicat la grupuri de maxim 30 de persoane Indicii ce trebuie urmrii sunt31: 1. numrul de alegeri primite 2. numrul de alegeri fcute 3. numrul de alegeri reciproce 4. numrul de respingeri primite 5. numrul de respingeri fcute 6. numrul de respingeri reciproce Cercetarea poate fi extins prin studierea celor ase indici pentru realizarea unei activiti profesionale ct i pentru realizarea unei aciuni n timpul liber. Centralizarea datelor se realizeaz ntr-o sociomatrice, iar ca reprezentare grafic putem folosi o sociogram. Modul n care realizm o sociogram este descris n capitolul 2 seciunea 2.3.4.

34

1.6. Msurarea datelor


La nceputul acestui capitol spuneam c ceea ce se obine prin diferite metode de investigare (o parte din ele le-am prezentat n seciunile anterioare) sunt date. Un prim pas spre transformarea acestor date n informaii este msurarea lor. n continuare, vom considera datele obinute n urma msurrii, date brute, celelalte tipuri de date numindu-le date prelucrate. Nu am folosit un antonim al expresiei date brute, deoarece prelucrarea datelor nu este niciodat definitiv, orice tip de date pretndu-se la prelucrri succesive, n funcie de fenomenul studiat. Msurarea este o operaie prin care se atribuie numere datelor discrete sau continue ce urmeaz a fi evaluate msurarea n dou moduri: citirea direct a numerelor afiate de aparatele cu care se efectueaz experimentul prin calcularea scorurilor sau a frecvenelor rezultate n urma aplicrii uni instrument specific (test, chestionar, etc.) Din prima categorie amintim: experienele din laboratorul de psihologie (cum ar fi frecvena apariiei unei reacii n funcie de un stimul studiat, parametrii fizici greutate, intensitate, etc.) timpul necesar pentru a rspunde unui stimul Din a doua categorie amintim:
32

. Putem realiza

35

aplicarea unui chestionar aplicarea unui test (nsumarea punctelor conform cu scalele) n cele ce urmeaz ne vom referi la msurtorile din cea de-a doua categorie. Dac, de exemplu, n fizic exist mrimi ce au uniti de msur bine definite (kg pentru mas, newton pentru greutate, m/s pentru vitez, etc.) n studiul fenomenelor sociale acest gen de uniti de msur nu exist. De aceea s-a recurs la utilizarea de msurtori prin nsumare pentru fenomenele sociale. Dintre nivelurile la care se pot realiza tipuri de msurtori amintim: nivelul nominal (calitativ) nivelul ordinal

nivelul hiperordinal33
Msurtori la nivel nominal reprezint tipul cel mai des ntlnit n fenomenele sociale. A folosi o msurtoare bazat pe nivelul nominal nseamn a ordona elementele msurate dup diferite categorii. Aceste categorii, pentru a putea avea un proces corect de ordonare34, trebuie s fie disjuncte, adic un element al unei categorii nu poate aparine n acelai timp i altei categorii.

36

Exemplul 20 Unui grup i se aplic un stimul35. n acest caz putem stabili patru categorii: a. nici o reacie b. doar reacie nonverbal c. doar reacie verbal d. i reacie verbal i reacie non-verbal Categoria d a fost pus deoarece subiecii pot avea reacii i la nivel de gest i la nivel verbal.

Exemplul 21 n cadrul unui chestionar aplicat unor tineri ntre 15 i 18 de ani s-a pus urmtoarea ntrebare deschis: Ce nseamn pentru tine a merge la coal? Dup ce s-au citit chestionarele primite s-au stabilit urmtoarele urmtoarele categorii: a. a nva b. a m plictisi c. conflicte cu ceilali d. pierdere de timp A mai fost folosit i o cincea categorie e. altele pentru acele situaii care nu se ncadrau n cale patru categorii stabilite, dar nici nu se regseau n numr destul de mare pentru a constitui o categorie de sine stttoare. Msurtori la nivel ordinal: acest tip de msurtori este cel mai folosit deoarece n urma folosirii lui se pot realiza comparaii ntre subieci, sau altfel spus se poate stabili o relaie de ordine ntre participanii la experiment. Exemplul 22

37

S-a aplicat testul Hamilton pe un lot de 20 de brbai i s-au obinut urmtoarele rezultate: Hamilton S1 18 S2 16 S3 14 S4 15 S5 20 S6 10 S7 9 S8 14 S9 19 S10 18 S11 15 S12 11 S13 7 S14 20 S15 22 S16 15 S17 10 S18 17 S19 13 S20 17 Se observ c n urma msurrii s-a calculat pentru fiecare subiect valoarea obinut la test. Pornind de la aceste valori putem compara subiecii ntre din punctul de vedere al testului Hamilton. De exemplu putem spune c subiectul S4 a obinut un scor mai mare dect subiectul S7.

Msurtori la nivelul hiperordinal: La acest gen de msurtori adaugm, pe lng nivelul ordinal i o analiz a distanei dintre elementele situate pe scara de valori. Dei nu foarte folosit, acest nivel

38

de msurare reprezint un prim pas spre utilizarea mulimilor fuzzy36 n analiza datelor obinute n sociologie sau psihologie. Exemplul 23 n cadrul unui studiu asupra unui grup de 10 elevi s-a alctuit o list cu mediile celor 10 elevi37 (datele au fost ordonate descresctor): Nota Elev 1 10 Elev 8 10 Elev 9 10 Elev 6 7 Elev 10 7 Elev 4 6 Elev 2 5 Elev 3 5 Elev 5 5 Elev 7 5 Se observ, din analiza distanelor dintre notele elevilor, c se pot determina trei grupuri de elevi: primul grup ar putea fi alctuit din cei care au obinut nota 10 (elevul 1, elevul 8, elevul 9), al doilea grup din elevii care au notele 6, 7 (elevul 6, elevul 10 i elevul 4) i un al treilea grup format din elevii ce au nota 5 (elevul 2, elevul 3, elevul 5 i elevul 7). Aceste scri de intervale pot constitui un punct de plecare n analiza datelor obinute din acest experiment.

39

CAPITOLUL 2: Reprezentarea datelor ca mod de examinare preliminar fenomenului studiat


The preliminary examination of most data is facilitated by the use of diagrams. Diagrams prove nothing, but bring outstanding features readily to the eye; they are therefore no substitute for such critical tests as may be applied to the data, but are valuable in suggesting such tests, and in explaining the conclusions founded upon them38 R.A. Fisher

A prezenta datele nu nseamn doar a le nirui pe o foaie de hrtie. Reprezentarea datelor reprezint o etap important a prelucrrii datelor. nainte de arta cum putem realiza aceast stocare a datelor vom prezenta cte ceva despre datele culese din teren apoi vom arta diferite moduri de a prezenta datele: prin diagrame, prin scheme, sociograme. O seciune aparte o va constitui prezentarea graficului Gantt ca mod de planificare a unui proiect.

2.1. Serii de numere


n aceast seciune ne vom referi la seriile de numere aa cum pot fi ele ntlnite n majoritatea proceselor sociale, fr a face referire la semnificaia matematic a conceptului de serie, semnificaie care este

40

mult mai larg. n acest context vom nelege prin serie de numere, mulimea de numere ce au o caracteristic comun. Pentru a nelege mai bine aceast noiune vom da dou exemple. Exemplul 24 Avem un lot de 15 subieci de sex masculin crora le aplicm un test de inteligen. Mulimea alctuit din rezultatele la acest test reprezint o serie de numere, caracteristica lor comun fiind faptul c ne arat coeficientul de inteligen al subiecilor din lot. Putem avea o a doua serie de numere ce reprezint coeficientul de inteligen al subiecilor de sex feminin dintr-un lot de 15 subieci. Problema ce ar putea aprea este de a compara cele dou loturi prin prisma acestor dou serii de numere. Exemplul 25 S presupunem c avem o ntrebare dintr-un chestionar ce este aplicat pe dou grupuri de subieci, unul n mediul rural iar al doilea n mediul urban. S presupunem c n urma prelucrrii datelor am obinut urmtoarele rezultate: Mediul Da Nu Rural 64% 36% Urban 52% 48% n acest caz o prim serie de numere o reprezint procentele la rspunsuri date de subiecii din mediul rural, iar o a doua serie o reprezint procentele date de subiecii din mediul urban. Dac o serie reprezint un proces ce se petrece n timp, atunci aceasta se va numi serie temporal39.

41

Exemplu 26 n tabelul de mai jos am msurat creterile anuale ale populaiei globului n perioada 1995 2000 Anii Nr locuitori 1995 80,781,974 1996 79,253,622 1997 79,551,074 1998 78,019,039 1999 76,861,716 2000 75,529,866 Seria este temporal ntruct ne arat un proces creterea populaiei, i acest proces este studiat ntr-o perioad de timp din anul 1995 pn n anul 2000. Analog putem avea serii de tip spaial40. Exemplul 27 n mai multe licee din Bucureti se pune urmtoare ntrebare profesorilor: Se poate vorbi de o dependen de computer n rndul elevilor? n urma prelucrrii datelor s-au obinut urmtoarele rezultate41: Locul Procent rspunsuri aplicrii afirmative Liceu sector 1 58 % Liceu sector 2 49% Liceu sector 3 61% Liceu sector 4 41% Liceu sector 5 40% Liceu sector 6 44% n acest caz seria de numere este studiat n aceeai perioad de timp, dar n puncte diferite din spaiu.

42

2.2 Gruparea datelor


n continuare vom da un exemplu pentru a arta dou moduri n care putem reprezenta aceleai date n funcie de modul n care am realizat gruparea. Exemplul 28 La un cabinet de testare psihologic a oferilor profesioniti s-a analizat situaia subiecilor testai n decursul unei sptmni. Deoarece avem foarte muli subieci realizarea unei diagrame n care s reprezentm nota obinut de fiecare subiect devine anevoioas, aceasta nu are nici o relevan, aa cum se poate observa i din diagrama de mai jos:
Rezultate test
70 60 50 40 30 20 10 0

10 11 12 13 14 15 16 17 18 19 20

n aceast situaie se poate recurge la gruparea datelor pe intervale. Dac avem lungime intervalului de 6 puncte atunci datele se vor putea pune astfel ntr-un tabel:

43

intervalul 36-44 45-53 54-63 nr subiecti 4 11 5 Astfel am obinut urmtoarea reprezentare a datelor:
Rezultate test
12 10 8 6 4 2 0

36-44

45-53

54-63

2.3. Reprezentri grafice ale seriilor de numere


Cnd ne referim la reprezentare grafic, nelegem reprezentarea datelor ntr-un sistem de coordonate. Reprezentrile grafice cu ajutorul unui sistem de coordonate se numesc diagrame. Uneori ns putem folosi alte reprezentri cum ar fi: tabele, figuri geometrice, hri, etc. O diagram conine, indiferent de form, un sistem de coordonate i o legend explicativ atunci cnd reprezentm mai multe serii de numere. Diagramele cele mai folosite sunt cele bidimensionale. Aa cum se poate deduce chiar din denumire, diagramele bidimensionale au dou axe. Axa Ox42 este axa pe care reprezentm etichetele seriei de numere43, iar pe axa Oy44 valorile corespunztoare acestor etichete.

44

2.3.1. Diagramele de tip linie


Reprezentarea datelor prin diagramele de tip linie45 este unul din modurile cel mai des folosite. Exemplul 29 La un test, n urma corectrii rezultatelor, s-au obinut urmtoarele note: cu nota 4 3 elevi, cu nota 5 5 elevi, cu nota 6 2 elevi, cu nota 7 - 4 elevi, cu nota 8 3 elevi, cu nota 9 4 elevi, cu nota 10 3 elevi. Cu rezultatele expuse mai sus realizm un grafic:
Nr.elevi 7 6 5 4 3 2 1 0 4 5 6 7 8 9 10

Folosind reprezentarea datelor cu ajutorul graficului, informaia obinut devine mai ampl dect n cazul prezentrii prin tabel. Putem observa imediat n exemplul 28 faptul c n clas exist cele dou tipuri de elevi: cei care se centreaz n jurul notei 5 i cei care se centreaz n jurul notei 7. Dac n loc de note realizm o analiz a fenomenelor n funcie de timp, atunci graficul ne va arta evoluia n timp a unui proces:

45

Exemplul 30 Dorim s analizm creterea populaiei globului n perioada 1994-200446. Atunci vom pune pe axa Ox anii iar pe Oy valorile. Vom obine urmtorul grafic:
6.5 6.4 6.3 6.2 6.1 Miliarde 6.0 5.9 5.8 5.7 5.6 5.5 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Acest tip de grafice se poate observa faptul c dac, pe scala Oy schimbm valorile forma graficului se schimb. n cazul de mai sus valorile de pe axa Oy sunt ntre 5,5 miliarde i 6,5 miliarde. Dac ns lum valorile ntre 2,5 i 6,5 miliarde vom obine urmtorul grafic:
6.5 6.0 5.5 5.0 Miliarde 4.5 4.0 3.5 3.0 2.5 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

46

n acest caz creterea nu mai pare att de pronunat ca n primul caz. (Iat o prim justificare a faptului c nu ne putem baza pe forma unei diagrame ci avem nevoie de instrumente obiective cum ar fi analiza statistic a datelor). Desigur apare ntrebarea: Care din cele dou diagrame este fi cea corect? Corecte sunt amndou. Alegerea scalei este dat de problema studiat: Dac, de exemplu, studiem creterea populaiei n raport cu anul 1994, atunci este recomandabil prima reprezentare. Dac ns dorim s ne raportm la anul 1950 cnd populaia globului era aproximativ 2,5 miliarde atunci este recomandabil cea de-a doua reprezentare. Fr ns s apelm la calcule statistice putem prelucra datele astfel nct s obinem noi informaii chiar din aceste date. Exemplu 30 (continuare) Putem reprezenta, tot n aceeai perioad, cu ct a crescut populaia n fiecare an comparativ cu anul anterior. Vom obine datele: 1995-1994 1996-1995 1997-1996 1998-1997 1999-1998 2000-1999 2001-2000 2002-2001 2003-2002 2004-2003 80,781,974 79,253,622 79,551,074 78,019,039 76,861,716 75,529,866 74,220,528 73,002,863 72,442,511 72,496,962

47

Ca reprezentare vom folosi din nou diagrama de tip linie. Dup cum se observ din diagrama de mai jos, dei populaia globului continu s creasc, se observ o scdere continu a ritmului de cretere.
Ritmul de cretere al populaiei globului
82 80 78 Milioane 76 74 72 70 68
9 19 5-1 99 4 9 19 6-1 99 5 9 19 7-1 99 6 9 19 8-1 99 7 9 19 9-1 99 8 0 20 0-1 9 99 01 20 -20 00 0 20 2-2 00 1 0 20 3-2 2 00 0 20 4-2 00 3

n lucrul cu diagrame de tip linie putem ntlni urmtoarele tipuri de reprezentri:

datele grupate la cea mai mic valoare47

date grupate la cea mai mare valoare

48

c) Datele distribuite normal

n practic desigur se pot ntlni mult mai multe tipuri de grafice, dar ne-am oprit la acestea i prin prisma noiunilor ce vor fi predate n capitolele urmtoare.

2.3.2. Histogramele
Un alt mod de reprezentare a datelor este prin histograme. Acest tip de diagram l folosim atunci cnd dorim s comparm valorile ntre anumite categorii.

49

Exemplul 31 In perioada noiembrie 2003 februarie 2004, s-a pus urmtoarea ntrebare elevilor de liceu din clasa a 11-a i a 12-a: La ce facultate vei da examen dup bacalaureat? n urma centralizrii datelor s-au obinut urmtoarele rezultate48:

Facultate ASE Drept Medicin Informatica Politehnic Litere Psihologie Jurnalism

Procent 10,7% 12,8% 6,7% 7,0% 4,4% 6,6% 6,3% 2,8%

Ca observaie, dei ntrebarea se referea clar la facultatea la care vor da examen, totui se observ c un procent important au dat ca rspuns o instituie ntreag (cum ar fi Academia de Studii Economice). ntruct acest lucru l-am considerat important pentru studierea opiunilor pentru o facultate, am lsat aceste opiuni.
100% 75% 50% 25% 0%
t ca re lo g ie Ps i ho AS E Li t e Dr a ti Ju rna rm li s m ep

50

In f o

n acest caz pe axa Ox am pus etichetele (ASE, Drept, Medicin, etc.), iar pe axa Oy am pus valorile corespunztoare fiecrei etichete. Tot n cadrul aceleai cercetri am pus o ntrebare pe aceea i tem i prinilor elevilor: La ce facultate va da examen dup bacalaureat fiul/fiica dumneavoastr? Facultatea Opiuni elevi Opiuni prini ASE 10,7% 16,8% Drept 12,8% 15,0% Medicin 6,7% 7,6% Informatica 7,0% 6,5% Politehnic 4,4% 7,8% Litere 6,6% 5,0% Psihologie 6,3% 4,1% Jurnalism 2,8% 2,8% Am pus pe aceeai diagram rspunsurile elevilor i a prinilor.
18.00% 16.00% 14.00% 12.00% 10.00% 8.00% 6.00% 4.00% 2.00% 0.00% ASE Drept Medicin Informatica Politehnic elevi prini Litere Psihologie Jurnalism

Observaie. Atunci cnd am realizat diagrama doar cu opiunile elevilor am pus pe axa Oy valorile de la 0% la 100%, pentru a putea

51

realiza o prim analiz a opiunilor elevilor n raport cu totalul opiunilor elevilor. n al doilea caz, am pus pe axa Oy valori ntre 0% i 18 % pentru a scoate n eviden eventualele diferene ntre opiunile prinilor i a elevilor. 2.3.3. Alte tipuri de diagrame Reprezentarea pe care o putem da datelor se poate realiza n mai multe moduri (datele sunt cele de la exemplul 30.

diagrama de tip disc49 - dac dorim s scoatem n eviden


procentul opiunilor elevilor raportndu-ne la total. Dar n aceast situaie ar trebui s mai introducem i restul opiunilor sau, pentru simplificarea reprezentrii, putem s mai introducem o nou categorie, alte opiuni. n acest caz obinem urmtoarea diagram:
ASE 10.7%

Alte optiuni 42.7%

Drept 12.8%

Medicin 6.7% Informatica 7.0% Psihologie 6.3% Litere 6.6% Politehnic 4.4%

Jurnalism 2.8%

52

diagrama de tip bar


Jurnalism Psihologie Litere Politehnic Informatica Medicin Drept ASE 0.00% 5.00% 10.00% 15.00% 20.00% Opiuni prini Opiuni elevi

diagrama de tip linie

53

18.00% 16.00% 14.00% 12.00% 10.00% 8.00% 6.00% 4.00% 2.00% 0.00%
ASE Drept Medicin Informatica Politehnic Litere Psihologie Jurnalism Opiuni elev i Opiuni prini

diagrama de tip inel (doughnut)

ASE Drept Medicin Informatica Politehnic Litere Psihologie Jurnalism

diagrama tip arie i coloane

54

18.00% 16.00% 14.00% 12.00% 10.00% 8.00% 6.00% 4.00% 2.00% 0.00%
ASE Drept Medicin Informatica Politehnic Litere Psihologie Jurnalism Opiuni elev i Opiuni prini

Un alt mod de a clasifica diagramele este raportarea la numrul de coordonate n care este realizat diagrama. Cele mai uzuale sunt: bidimensional i tridimensional. Bidimensional
82,000,000 80,000,000 78,000,000 76,000,000 74,000,000 72,000,000 70,000,000 68,000,000 1995- 1996- 1997- 1998- 1999- 2000- 2001- 2002- 2003- 20041994 1995 1996 1997 1998 1999 2000 2001 2002 2003

55

14.0% 12.0% 10.0% 8.0% 6.0% 4.0% 2.0% 0.0%


a ih ol og ie Ps In fo rm Ju rn al ism re pt Li te re AS D at ic E

ASE 11% Alte optiuni 42% Drept 13% Medicin 7% Inform atica 7% Litere 7% Politehnic 4%

Jurnalis m 3% Ps ihologie 6%

56

Tridimensional
82,000,000 80,000,000 78,000,000 76,000,000 74,000,000 72,000,000 70,000,000 68,000,000 1995- 19961997- 19981999- 20001994 1995 1996 2001- 20021997 1998 2003- 20041999 2000 2001 2002 2003

14.0% 12.0% 10.0% 8.0% 6.0% 4.0% 2.0% 0.0%


In fo rm at ic a Li te re Ps ih ol og ie Ju rn al is m E AS D re pt

57

ASE Alte optiuni 42.7% 10.7% Drept 12.8% Medicin 6.7% Informatica Jurnalism 2.8% Psihologie 6.3% Litere 6.6% 7.0% Politehnic 4.4%

2.3.4. Sociograme O prim etap n aplicarea sociometriei este realizarea sociomatricei. Exemplul 32 ntr-o echip de lucru s-a pus problema realizrii de subechipe de cte doi muncitori care s execute anumite operaiuni mpreun i a gsirii unui coordonator al acestor subechipe. Pentru aceasta s-au pus o serie de ntrebri membrilor echipei. Una din ntrebri a fost: Dac ar trebui s faci o deplasare n vederea executrii unei lucrri de o zi pe un alt antier cu cine ai merge? Subiecii au dat urmtoarele rspunsuri50 :

58

Putem observa c S5, S6, S7, S9 nu au nici o opiune, c S1 i S3 au o opiune, S2 i S8 au dou opiuni i S4 are trei opiuni. Este ns destul de greu ca din tabelul de mai sus s punem n eviden i relaiile ntre subieci. Un mod de reprezentare ar putea fi sub form de cercuri concentrice, unde n cercul interior vom pune pe cei ce au 0 opiuni, iar n cercul cel mai mare vom pune pe cei cu 3 opiuni. n plus, vom duce nite sgei de la subiectul ce a ales la subiectul ales. Dac doi subieci s-au ales ntre ei, de exemplu S1 cu S3, atunci sgeata va avea dublu sens Exemplul 32 (continuare)

S1 S3 S5 S6 S2 S9 S7

S8 S4

59

n capitolul 4, n seciunea 4.1.6. vom vedea c putem continua prelucrarea acestor date prin realizarea grafului asociat i a unei matrice asociate sociogramei. 2.3.5. Alte reprezentri a datelor Aa cum am specificat la nceputul acestui capitol, n afar de diagrame, mai exist o serie de reprezentri pentru analiza datelor. Pentru a explica mai bine vom reveni la exemplul 30. S presupunem c dorim s analizm comparativ opiunile prinilor cu cele ale elevilor. Pentru aceasta putem folosi urmtoarea regul: dac diferenele procentuale ntre opiunile prinilor i opiunile elevilor sunt mai mici de 2% atunci vom spune c acestea nu difer. n aceast situaie vom avea opiuni comune pentru prini i elevi i opiuni specifice fiecrei categorii. Putem reprezenta aceste date astfel:

COMUN
Medicin Informatic Litere Jurnalism

Prini
ASE Drept Politehnic

Elevi Psihologie

60

Desigur, pentru figura de mai sus se poate folosi orice tip de form.

2.4. Noiuni introductive de prezentare a datelor n Power Point


Odat ce am gsit modul de reprezentare (diagrame, scheme, etc.) a datelor atunci cnd ne gndim la prezentarea lor n public (fie c e vorba de comisia de licen, fie la o sesiune de comunicri) trebuie s gsim un mod de prezentare ct mai clar i uor de folosit. O prim metod este realizarea unui poster. Ce este un poster? n general e o coal de carton cam de un metru nlime i 50 de cm lungime pe care se lipesc patru-cinci foi format A4 cu diagrame i/sau diferite tabele cu date mai importante. La sesiunile de comunicri se aloc timp distinct pentru acest gen de prezentri unde, autorul (autorii) pun posterul n zona special amenajat pentru acest gen de prezentri i rspund la eventualele ntrebri puse de cei ce citesc i sunt interesai de ceea ce se prezint n poster. O alt metod este de a pregti nite transparente ce se pot pune la un retroproiector, fiecare folie transparent fiind pus de cel ce prezint i d explicaii audienilor. O a treia metod este de a pregti pe un computer toat prezentarea i de a prezenta folosind un videoproiector.

61

Desigur mai pot fi i alte metode de prezentare, dar ne-am mrginit la acestea trei ntruct reprezint cele mai rspndite moduri de prezentare care se pot folosi n mai toate universitile. Materialul pentru toate cele trei metode poate fi pregtit bazndu-ne pe un soft specializat: Power Point, Open Office, Staroffice, etc. Deoarece la ora actual cel mai cunoscut este Power Point vom face o scurt prezentare a acestuia.

2.4.1. Ce este power Point?


Power Point reprezint un soft specializat pentru prezentri profesionale. Concret, el are multe din facilitile celorlalte soft-uri de la Microsoft, cum ar fi: editare text, tabelare, realizarea de desene, importarea de fiiere din alte programe. Cnd se creeaz o prezentare cu Power Point, aceasta se face pe baz de slide- uri51. Prezentarea se poate realiza ntr-un singur fiier i la ea, pe lng imagine, se pot ataa i fiiere audio (cum ar fi vocea prezentatorului sincronizat cu parcurgerea automat a slide-urilor sau o melodie, etc.)

2.4.2. Cum ncepem?


S-ar putea ca icon-ul s fie pe ecran (desktop) i atunci dnd un dublu-clic pe acest icon se deschide Power Point. Dac nu vedei icon-ul pe ecran atunci dai un clic pe butonul de START (se afl deobicei n stnga-jos pe ecran) i din fereastra ce se deschide alegei Programs , apoi Power Point.

62

Pe ecran, n partea dreapt va aprea o fereastr ca cea de mai jos:

Open a presentation aa cum arat i titlul, n aceast parte a ferestrei se gsete o list cu ultimele fiiere salvate. Dac dorim s deschidem unul din acest fiiere este suficient s dm un clic pe denumirea fiierului. New folosind aceast parte a ferestrei putem crea o prezentare slide cu slide pornid de la slide-uri albe52 (Blank Presentation), s realizm o prezentare pornind de la slide-uri preformatate (From Design Template) sau s crem o prezentare fiind ghidai de un program specializat (From AutoContent Wizard)

63

New from existing presentation crearea unei noi prezentri pornind de la o prezentare deja salvat pe computer. New from templates realizarea unei noi prezentri pornind de la forme predefinite fie de pe computer, fie de pe WEB Observaie diferena dintre From Design Template i New from templates const n faptul c n timp ce n primul caz afiarea slide-urilor preformatate se face n fereastra din stnga ecranului, n al doilea caz slide-ul preformatat se alege dintr-o list de slide-uri. Acum s alegem opiunea Blank Presentation i s dm un clic pe aceasta. Va aprea pe ecran n centru o foaie alb cu dou dreptunghiuri trasate cu linie punctat. n cel de sus putem s introducem titlul slide-ului, iar n cel de jos un text. Tot n momentul n care am dat clic pe opiunea Blank Presentation n partea dreapt a ecranului va aprea urmtoarea fereastr:

64

Dac dorim de exemplu, ca titlul sa fie mai sus iar sub acest titlu s avem dou coloane, dm un clic pe icon-ul ncadrat. Textul, inserarea de imagini, etc. se realizeaz ca ntr-un editor de texte. n continuare vom arta modul n care se poate realiza vizualizarea acestor slide-uri.

2.4.3. Cum se realizeaz vizualizarea n Power Point?


n fereastra de lucru, n partea stnga-jos avem un grup de trei butoane:

Le vom prezenta pe rnd: Cel mai din stnga buton este butonul activat implicit i vizualizeaz cte un slide, astfel nct se pot face modificri pe acel slide afiat. n acest mod avem acces la toate opiunile din meniul Power Point. Urmtorul buton vizualizeaz n modul Outline, adic putem vedea slide-urile realizate n ordinea lor, nu putem face modificri in slide-uri, dar putem schimba ordinea lor astfel: mergem cu mouse-ul pe slide-ul cruia dorim s-i schimbm poziia, cnd ajunge cursorul pe acel slide, inem apsat butonul din stnga al mouse-ului i apoi micm mouse-ul pn aducem slide-ul n poziia dorit. Atunci ridicm degetul de pe mouse.

65

Cel mai din dreapta buton

, numit slide-show, este prin care

putem intra n modul prezentare a slide-urilor pornind de la slide-ul afiat iniial. n seciunea ce urmeaz vom prezenta acest mod de vizualizare.

2.4.4. Modul de vizualizare Slide-Show


Cnd se folosete acest mod de vizualizare, slide-ul va ocupa tot ecranul, astfel nct de pe ecran vor disprea bara de titlu, meniurile i orice alt element ce nu face parte din slide. n acest moment computerul e folosit ca un proiector de slide-uri
53

. Atunci cnd utilizatorul i

pregtete prezentarea, are pentru acest mod o serie de opiuni privind modul n care s apar titlurile pe pagin (simularea venirii titlurilor din diferite pari ale ecranului, rotirea titlului pn ajunge n poziia destinat, etc.), a vitezei de succesiune a slide-urilor, etc. Desigur n aceste cteva pagini nu ne-am propus dect s facem o scurt prezentare a posibilitilor de prezentare a soft-ului Power Point. Cei ce vor s afle mai multe despre acest mod de prezentare computerizat al datelor i sftuim s mearg la manualele de specialitate cum ar fi [Bott] , [Kin].

2.5. Graficul Gantt


Graficul Gantt reprezint un instrument de planificare care poate fi folosit pentru alocarea timpului pentru diferite etape ce trebuie

66

realizate n cadrul unui proiect. Acest tip de reprezentare este printre cele mai folosite de ctre manageri n planificarea diferitelor proiecte deoarece este uor de neles i de construit. Fiecare sarcin este aezat pe cte o linie. Pe coloane se pun datele (zile, sptmni sau luni n funcie de durata proiectului). Sarcinile pot decurge secvenial sau n paralel. n realizarea unui grafic Gantt trebuie s inem avem un numr rezonabil de sarcini astfel nct s le putem gestiona. Exemplul 33 S vedem cum s-ar putea pune sub forma unui grafic Gantt etapele realizrii unui proiect de diplom. S presupunem c avem urmtoarele etape de realizare a unui proiect:

Nr Denumirea activitii 1 Stabilirea obiectivelor 2 Determinarea ipotezelor ce rezult din fiecare obiect 3 Stabilirea lotului de lucru 4 Stabilirea instrumentelor 5 Culegerea datelor de pe teren 6 Centralizarea, prelucrarea i analizarea datelor 7 Revenirea pe teren pentru a mai culege date de pe te 8 Centralizarea, prelucrarea i analizarea noilor date 9 Finalizarea lucrrii Atunci graficul Gantt este:

67

2.6. Concluzii
n finalul acestui capitol dorim s relum ideea lui R.A. Fisher n ceea ce privete rolul reprezentrii datelor n ceea ce privete analiza i interpretarea lor: Examinarea preliminar a celor mai multe date este facilitat de folosirea diagramelor. Diagramele nu demonstreaz nimic, dar aduc caracteristici excelente mai aproape de privire; de aceea ele nu reprezint un nlocuitor pentru teste ce pot fi aplicate datelor, dar sunt valoroase n analiza acestor teste i n a explica concluziile bazate pe ele54.

68

CAPITOLUL 3: Statistica n cercetarea social


Celor care spun c se poate demonstra orice cu statistica le rspund: cu statistica prost folosit se poate demonstra orice R.A. Fisher

n cele ce urmeaz vom prezenta anumite noiuni din statistica matematic. n general prezentarea va fi mai mult intuitiv, pentru o prezentare mai riguroas a noiunilor recomandm consultarea unui curs de statistic social55. Fiecare seciune va avea la nceput exemple de cercetri care reprezint diferite moduri de a pune problema. Rspunsurile pentru problemele puse la nceputul fiecrei seciuni se vor gsi n seciunea 3.13.

3.1. Caracteristici (variabile)


Exemplul 34 Pentru proiectul de diplom un student i-a ales tema: Complexul de inferioritate la adolesceni. Ce ar trebui s cerceteze studentul n cadrul acestui proiect?

Exemplul 35
La dou clase a VI-a din aceeai coal, existau performane colare semnificativ diferite, una din

69

clase avnd rezultate foarte bune i foarte muli copii participani la olimpiade cu rezultate foarte bune, n timp ce la cealalt clas, dei aveau cam aceeai profesori, problema principal a elevilor era s nu rmn corigeni. Pe ce ar trebui s se axeze un eventual studiu de determinare a cauzelor diferenelor ntre performanele colare ale elevilor?

Ceea ce face ca anumite elemente s fie grupate pentru analiz este o caracteristic comun. Numerele rezultate n urma aplicrii unui test de inteligen vor putea fi analizate mpreun deoarece au comun caracteristica dat de coeficientul de inteligen. Caracteristicile poart numele de variabile. Deci pentru a defini o variabil avem nevoie de o etichet pentru elementul msurat i acestei etichete i se asociaz o proprietate56. Exemplul 36 Pentru subiecii crora li s-a aplicat un test de inteligen se poate reprezenta variabila sub urmtoarea form:
Etichet Valoare coef de intelig Subiect 1 117 Subiect 2 100 Subiect 3 98 Subiect 4 79 Subiect 5 102

ntruct ceea ce ne va interesa este caracterizarea unui grup de elemente, vom folosi n continuare denumirea de caracteristic. Caracteristicile vor de tip calitativ sau cantitativ. Caracteristicile de tip calitativ, aa cum se poate deduce din denumire ne arat o calitate a elementelor grupului.

70

Exemplu 37 Putem avea caracteristica grad universitar i atunci ea ar putea fi de forma:


Etichet Grad universita r
Subiect 1 Confereniar Subiect 2 Lector Subiect 3 Lector Subiect 4 Preparator

Caracteristicile de tip cantitativ sunt cele n care studiem valori asociate elementelor grupului. Exemplul 38 Dac studiem indicele de depresie la un grup, caracteristica va arta astfel:
Etichet Indice de depresie Subiect 1 55 Subiect 2 40 Subiect 3 46,25 Subiect 4 32,5

O abordare mai riguroas a datelor se poate da prin schema de mai jos:


Date

Calitative

Cantitative

Nominale: Grad univ., culoarea parului, etc.

Ordinale Locul intr-un concurs, nr de concursuri catigate

Discrete: Indice depresie, valoare coef inteligen

Continui: Valorile nlimii unui copil ntre 0-1 an

71

3.2. Populaie.
Exemplul 39 Pentru realizarea unui sondaj privitor la alegerile locale dintr-un anumit ora, din cine se compune mulimea pe care o studiem? Dar dac sondajul s-ar referi la alegerile generale? Populaia57, din punct de vedere statistic, reprezint mulimea de elemente care au una sau mai multe caracteristici comune. De exemplu, putem avea populaia alctuit din persoanele din mediul urban, n acest caz caracteristica comun fiind mediul. Putem avea i o populaie alctuit din persoanele de sex feminin din mediul rural. n aceast situaie, persoanele au dou caracteristici comune ce le reunesc ntr-o populaie: faptul c sunt de sex feminin, i c sunt din mediu rural. Elementele populaiei pot fi: persoane, obiecte, evenimente, idei, opinii, etc. Putem spune c asupra elementelor unei populaii acioneaz aceleai legi statistice din punct de vedere al caracteristicii studiate. n raport cu aceste legi se poate defini gradul de omogenitate al unei populaii. Pentru studiile n tiinele sociale aceast omogenitate ne poate fi foarte folositoare n realizarea de predicii asupra populaiei studiate. Un posibil rezultat ar putea fi: cu ct omogenitatea este mai mare cu att gradul de siguran al prediciei va fi mai mare.

72

Exemplul 40 Lund caracteristica - nvarea limbii franceze la coal n clasa a 6-a, putem avea o populaie alctuit din elevii de clasa a 6-a ce nva limba francez la coal. S-ar putea ca omogenitatea acestei populaii s fie foarte mic, datorit faptului c elevii provin din mediul urban, iar alii din mediul rural. Desigur, n acest caz, putem transforma studiul i vom spune c analizm dou populaii: o prim populaie compus din elevii de clasa a 6-a ce nva francez i sunt din mediu urban i o a doua populaie compus din elevii de clasa a 6-a ce nva francez i sunt din mediul rural. S observm c fiecare populaie are n fapt 3 caracteristici: nva limba francez, sunt n clasa a 6-a i mediul cruia aparin. Exemplul 41 S presupunem c dorim s realizm un studiu asupra cumprtorilor dintr-un magazin. n acest caz vom analiza dou populaii: o prim populaie alctuit din localnicii ce cumpr din acel magazin i o a doua populaie alctuit din turitii ce au fcut cumprturi n acel magazin. Dac ns dorim s comparm cumprturile realizate de localnici cu cumprturile realizate de turiti, atunci s-ar putea s obinem o omogenitate mai mic a celor 2 populaii i atunci sar putea s fim nevoii s studiem dup o alt caracteristic, s zicem sexul cumprtorilor. n acest caz vom avea 4 populaii: populaia de localnici de sex feminin ce cumpr din magazin, populaia de turiti de sex feminin ce cumpr din magazin, populaia de localnici de sex masculin ce cumpr din magazin i populaia de turiti de sex masculin ce cumpr din magazin. Ca exerciiu v putei imagina ca o caracteristic de care se poate ine cont n realizarea populaiei, vrsta celor ce fac cumprturi

73

n acel magazin. Desigur mprirea dup prea multe caracteristici duce la un numr mare de populaii studiate, ceea ce ngreuneaz considerabil cercetarea. Putem uni dou populaii ntr-una singur atunci cnd diferenele ntre ele nu sunt semnificative. La nivel conceptual, totul pare destul de corect, ns din punct de vedere practic, chiar i cazul n care avem de analizat caracteristicile unei singure populaii apar destule probleme58. Pentru a nelege mai bine acest lucru este suficient s ne gndim la recensmntul populaiei unei ri. Am dat acest exemplu pentru a arta c totui analiza fiecrui individ al unei populaii se realizeaz, dei este destul de dificil de realizat. n situaia cnd se realizeaz analiza unei populaii prin analiza fiecrui individ, tiina ce descrie aceast populaie se numete Statistic Descriptiv. Totui, n cele mai multe cazuri realizarea unei statistici descriptive nu se realizeaz. n aceste cazuri se folosesc uniti statistice mai mici pe baza lor putndu-se realiza o extensie la populaie. Acest gen de statistic se numete Statistic Inferenial. n seciunea urmtoare vom prezenta diferite tipuri de uniti statistice.

3.3. Eantion. Lot.


Exemplul 42 O firm dorete s lanseze ntr-un anumit ora un produs i ar dori s afle prerea populaiei din acel ora referitor la produs. Cel mai sigur ar fi s ntrebe pe toi locuitorii din ora, dar costurile i ca timp i

74

financiare ar fi destul de ridicate. Care ar fi soluia pentru a reduce costurile? O definiie destul de uzual este: eantionul un subansamblu al unei populaii59. Pornind de la aceast definiie putem observa c un eantion reprezint mulimea de elemente60 care au una sau mai multe caracteristici comune. Desigur ai observat c aceast definiie este asemntoare cu cea a populaiei. Deci unde este diferena? Numrul de elemente, n cazul eantionului, este mai mic dect cel al populaiei. Dar oare avnd un grup elemente ce au aceeai caracteristic putem s spunem ceva despre populaie? Rspunsul este afirmativ doar dac eantionul este reprezentativ, dac el conine la nivel micro toate elementele eseniale ce se regsesc n toat populaia. Exemplul 43 Pornind de la ipoteza61: Cu ct crete vechimea n munc cu att dorina de schimbare scade. n acest caz vom avea dou eantioane: Primul va fi format din muncitori angajai de curnd, iar al doilea din muncitori ce au o vechime mai mare n munc. S presupunem c dorim s studiem dac un fenomen poate influena o mulime de elemente. Vom face msurtorile pentru o mulime nainte de petrecerea fenomenului i apoi, pe aceeai mulime, vom face msurtori dup petrecerea fenomenului. n acest caz nu o caracteristic realizeaz reunirea ntr-un grup a elementelor. Pentru acest gen de situaii se folosete denumirea de lot. Primul lot62 se va numi lot de control, iar cel de-al doilea lot63 se va numi lot experimental.

75

Exemplul 44 Dorim s studiem dac sistemului de notare cu note de la 1 la 100 ar fi mai bun dect sistemul de notare de la 1 la 10. Pentru aceasta vom lua dou loturi. n primul lot vom avea elevii unei clase la care vom face notarea de la 1 la 10, iar al doilea lot vom avea elevii din alt clas unde vom face notarea de la 1 la 100. n acest caz am folosit denumirea de lot ntruct obiectul studiului l reprezint metoda de notare i nu elevii n sine64.

3.4. Eveniment
Exemplul 45 Un operator trebuie s aplice un chestionar pe teren persoanelor peste 40 de ani de sex masculin. Avnd multe refuzuri, fiind destul de obosit, s-a dus acas unde a rugat nite prieteni s-l ajute completeze chestionarele. Cum s-a modificat evenimentul? Exemplul 46 Un student avea ca tem studiul ateniei concentrate la elevii de clasa a 3-a. n urma centralizrii datelor a venit la profesorul ndrumtor cu urmtorul tabel:

76

Atentia Varsta concentrata B.B. 70 9 ani T.E. 90 9 ani C.A. 90 9 ani R.I. 100 10 ani S.E. 90 9 ani S.P. 90 10 ani P.V. 90 9 ani L.I. 90 9 ani B.D. 70 10 ani T.C. 90 9 ani B.A. 90 9 ani A.B. 100 7 ani P.F. 90 10 ani B.D. 60 9 ani R.C. 100 9 ani I.V. 80 9 ani C.A. 100 8 ani S.S. 90 13 ani P.A. 100 9 ani N.R. 90 9 ani n urma examinrii acestui tabel, profesorul i spune c trebuie s verifice datele i ca tabelul nu e complet, deci proiectul nu poate fi notat. Subiecti Odat stabilit tipul de unitate statistic cu care vom lucra65, vom dori s realizm diferite experimente, experiene pe tipul de unitate statistic ales. n teoria probabilitilor, rezultatul unei experiene se numete eveniment. Exemplu 47 S presupunem c dorim s analizm ct la sut din studeni vor intra n sala de curs n cele 10 minute dinaintea cursului. Populaia va fi compus din toi

77

studenii, deoarece indiferent de an i de facultatea de unde sunt studenii, toi au ore de curs n programa de nvmnt. Vom lua un lot66 de la un curs dintr-o anumit zi. Ca eveniment (rezultat al experienei) putem avea 20 de persoane ce au intrat in ultimele 10 minute. S notm acest eveniment cu A. Cu B vom nota evenimentul 30 de persoane au intrat n ultimele 10 minute i cu C vom nota evenimentul 70 de persoane au intrat n ultimele 10 minute la curs. Un alt tip de eveniment ar putea fi n ultimele 10 minute s intre la curs mai puin de 35 de persoane. Pe acesta l putem nota cu D. Se observ c evenimentul D include i evenimentul A i evenimentul B. Vom spune c evenimentele A i B sunt evenimente primare i evenimentul D este compus. Ca tipuri de evenimente putem avea cele dou cazuri extreme: a) Evenimentul imposibil (sau evenimentul nul), care, aa cum se poate deduce din denumire, este acel eveniment care nu se poate produce. Acesta se poate obine prin mbinarea a 2 evenimente care nu se pot produce n acelai timp. Exemplul 48 S spunem c avem evenimentul A: s obinem mai mult de 7 puncte la un joc i evenimentul B: numrul obinut la aruncarea unui zar. Evenimentul rezultat din combinarea67 celor dou evenimente este C: la un joc s obinem mai mult de 7 puncte la aruncarea unui zar. Acest lucru evident este imposibil.

78

b) Evenimentul total. Acest gen de eveniment este cel care se produce n mod sigur n urma unui eveniment. n continuare vom prezenta principali indicatori statistici ce se pot folosi n analiza primar a datelor. Indicatorii tendinei centrale sunt indicatori sintetici cu ajutorul crora urmrim s exprimm () ceea ce este tipic, esenial, stabil, obiectiv i caracteristic ntr-o serie de numere68.

3.5. Minimul i maximul


La o prim privire asupra datelor de tip cantitativ putem deja observa doi indicatori: minimul i maximul. Exemplul 49 ntr-un liceu am studiat manifestarea complexului de inferioritate la un lot de 30 de adolesceni. Studiem posibilitatea ca s avem o manifestare a complexului de inferioritate prin valene ridicate ale anxietii69. Se observ n datele centralizate n tabelul de mai jos c maximul este 33, iar minimul este 19. Pornind de la aceste constatri am putea, de exemplu, s ncepem prin a investiga elevii ce au obinut aceste rezultate extreme.

79

S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11

Nota A 32 31 33 27 29 25 23 22 25 21 25

Nota A S12 S13 S14 S15 S16 S17 S18 S19 S20 S21 S22 Nota A 25 19 23 27 32 31 33 27 29 25 23 S23 S24 S25 S26 S27 S28 S29 S30 22 25 21 25 25 19 23 27

3.6. Media
Exemplul 50 n urma aplicrii unui test de memorie pe un lot de copii s-au obinut urmtoarele rezultate: mem mem vizuala auditiva LM 5 6 VA 3 4 MA 2 4 TC 4 6 SA 2 2 TS 2 3 BR 4 5 FI 4 4 DC 6 8 CR 1 2 LL 3 4 Care sunt valorile pentru care am putea spune c un copil are memorie vizual bun n raport cu grupul

80

studiat? Exemplul 51 ntr-o lucrare cu titlul Legtura dintre mame i copii de 6 ani studentul, la prezentarea lotului pe care a fcut acest studiu a calculat media vrstelor componenilor lotului studiat. Este corect sau nu? Media reprezint unul dintre indicatorii cei mai folosii pentru prezentarea datelor. Cea mai utilizat medie este media aritmetic. Din punct de vedere matematic ea se poate defini astfel: Fiind dat o serie de n numere x1, x2, , xn, media aritmetic va fi

mx =

x1 + x 2 + ... + x n n

(1)

Folosind notaia x1 + x 2 + ... + x n = poate scrie:

i= 1

xi , formula (1) se mai

mx =

i= 1

xi

(2)

Observaie. Dac la aplicarea unui test obinem aceeai valoare pentru toi subiecii, s zicem 35, atunci media va chiar 35. Practic ns, un asemenea rezultat ar trebui s ne duc la investigarea validitii procedeului de aplicare al testului.

Exemplul 52

81

n urma unei lucrri de control la o clas elevii au obinut urmtoarele note: 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10. Pentru a realiza o evaluare a rezultatelor obinute profesorul dorete s calculeze media pe clas la acel test. Pornind de la modul de abordare a datelor avem dou posibiliti dea calcula media la testul pe clas. Metoda 1. Fie datele prezentate liniar. 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10. Folosind formula (1) obinem mx = 6,96. Metoda 2. Putem pune date sub forma unui tabel: 4 5 6 7 8 9 10 3 5 2 4 3 4 3 Unde, pe prima coloan am pus notele, iar pe coloana a doua am pus numrul de elevi corespunztori pentru fiecare not. Dac dorim s calculm media pentru a afla suma notelor putem calcula astfel 4.3 + 5.5 + 6.2 + 7.4 + 8.3 + 9.4 + 10.3 iar pentru a afla numrul de elevi putem aduna numerele din coloana a doua. Modul acesta de calcul este specific mediei ponderate. Cci media unui grup la un test este dat de notele i ponderile lor. Revenind la exemplu nostru lum x1 = 4, x2 = 5, x3 = 6, x4 = 7, x5 = 8, x6 = 9, x7 = 10, i ponderile p1 = 3, p2 = 5, p3 = 2, p4 = 4, p5 = 3, p6 = 4, p7 = 3. Atunci folosind formula mediei ponderate este:

m px =

x1 p1 + x 2 p 2 + ... + x n p n p1 + p 2 + ... + p n 82

(3)

vom obine mpx = 6,96 adic exact acelai rezultat ca la

metoda 1. Exemplul 53 S-a aplicat un test de atenie concentrat la copii din clasa a III-a. n urma testului s-au obinut urmtoarele rezultate: Atenie concentrat-cantitate Valori Ponderi 60 1 70 2 80 1 90 11 100 7 n acest caz media va fi: mpx = (60.1 + 70.2 + 80.1 + 90.11 + 100.7) / (1 + 2 + 1 + + 11 + 7 ) = 1970 / 22 = 89,54 Deci se poate presupune pentru aceast clas, c pentru caracteristica cantitate, avem 4 elevi cu o atenie concentrat mic, 11 elevi au o atenie concentrat medie i 7 au atenie concentrat mare. Problema care se pune n aceast situaie este de a raporta media acestei clase la media populaiei alctuit din elevii de clasa a III-a70.

n acest ultim exemplu am prezentat un alt rol al mediei: acela de indicator de poziie. Adic raportndu-ne la medie putem spune dac o valoare se afl ntr-o anumit categorie sau n alta. De exemplu, calculnd valoarea medie a nlimii unui grup, putem defini ce nseamn individ scund i ce nseamn individ nalt pentru acel grup.

83

Muli autori consider c avantajul mediei const n faptul c este uor de calculat. Totui acest lucru poate constitui i un dezavantaj, deoarece fiind uor de calculat comparativ cu ali indicatori, exist tendina ca s se trag concluzii n urma calculului medie. Concluzii care pot fi eronate.

3.7. Cuantile
De multe ori, n practic, informaii importante ne pot fi aduse de modul n care datele sunt distribuite ntre cea mai mare valoarea i cea mai mic valoare. Deoarece poziia lor n raport cu seria de numere este bine determinat, aceti indicatori se mai numesc i indicatori de poziie. De exemplu, putem scrie datele n ordine cresctoare i s vedem ce date se afl la stnga mijlocului i ce date se afl la dreapta mijlocului71. Valorile ce mpart seria de numere n pri egale se numesc cuantile.

3.7.1. Mediana
Exemplul 54 Studenii dintr-o grup au vrut s-i aleag un ef de grup. Pentru c nu au ajuns la un consens, au rugat un profesor s-i ajute n aceast problem. n urma discuiilor avute cu studenii profesorul a determinat 3 candidai pentru aceasta funcie. Apoi a pus pe fiecare student s acorde punctaje ntre 1 i 5 celor 3 candidai.

84

S-au obinut urmtoarele date: S10 S15 S1 1 3 S2 2 3 S3 1 3 S4 2 4 S5 5 3 S6 1 4 S7 5 3 S8 2 4 S9 2 3 S10 1 S11 5 3 S12 5 3 S13 5 4 S14 2 3 S15 5 S16 5 4 S17 2 3 S18 5 3 S19 5 3 S20 2 3 S21 5 4 S22 2 3

S22 5 5 5 5 2 3 2 1 2 2 2 1 2 5 5 2 2 5 2 5 5

media 3.29 3.19 3.24 mediana 2 3 2 Cine credei c este mai indicat s fie ales ef al grupei? Mediana este acea cuantil ce mparte o serie de numere n dou pri egale. Vom nota mediana cu Me. Modul de determinare al medianei se poate realiza n dou moduri (n funcie de numrul de elemente): 1) Dac avem un numr impar de valori, atunci mediana va fi cea care are numrul de elemente de la stnga egal cu numrul de elemente de la dreapta ei.

85

Exemplul 55 ntr-o echip A, li s-a cerut muncitorilor s noteze eful cu note de la 1 la 10. n urma centralizrii datelor s-au obinut urmtoarele rezultate: AM1 1 AM2 2 AM3 2 AM4 3 AM5 10

Note acordate n acest caz mediana este cea din dreptul lui AM3 i Me = 2. Eticheta AM3 se mai numete n acest caz element median72. 2) Dac avem un numr par de elemente, atunci mediana este egal cu media celor dou elemente de la mijlocul seriei de numere ordonate Exemplul 56 Analog cu problema pus la exemplul 55 s-a realizat o cercetare i la o echip B: BM1 BM2 BM3 BM4 BM5 BM6 Note 1 1 2 3 3 3 acordate Mediana este ntre BM3 i BM4, deci pentru a o calcula vom face media ntre valorile corespunztoare acestor etichete. Deci Me = 2,5 Care este rolul medianei? Mediana este util cnd, n analiza procesului, intervin preri subiective i exist pericolul ca valorile extreme s influeneze rezultatul73. Relund exemplele 54 i 55 s

86

presupunem c dorim s studiem urmtoarea problem: n care echip eful de echip este mai bine vzut de ctre subalterni? Dac am folosi media observm c eful echipei A obine media 3, n timp ce eful echipei B obine media 2,2. Deci am putea concluziona c eful echipei A este mai bine vzut de subalterni. Folosind mediana eful echipei A obine valoarea 2, n timp ce eful echipei B obine valoarea 3. Asimetria unei serii de numere o putem determina prin studierea poziiei medianei fa de medie. n capitolul anterior, n finalul seciunii 2.3.1. am vzut cum se reprezint cele dou extreme(date grupate la cea mai mic valoare, respectiv la cea mai mare valoare). n practic, aceste cazuri le putem ntlni foarte rar. Ne-ar putea interesa ns situaiile n care seria de numere tinde spre o extrem sau alta. Cnd avem curba situat mai spre stnga datelor, vom spune c avem o asimetrie spre stnga, ceea ce n practic ne va indica tendina valorilor de a se grupa spre cele mai mici valori. Analog se poate concluziona atunci cnd avem curba datelor spre dreapta. Exemplul 57 ntr-un studiu comparativ s-a aplicat un test de evaluarea a singurtii emoionale74 pe dou loturi de tineri: primul lot a fost format din tineri cu studii superioare 75, iar al doilea din tineri ce au doar studii liceale76. n urma centralizrii datelor s-au obinut urmtoarele rezultate:

87

TSL TSS TSL TSS TSL TSS 8 6 0 10 7 4 5 14 3 21 6 12 1 11 10 11 3 10 13 10 27 3 12 16 12 11 20 19 11 6 13 13 7 10 16 13 7 5 9 6 10 2 12 6 5 3 1 4 10 9 3 1 n urma calculelor, pentru TSL s-a obinut media mTSL = 8,57 i mediana MeTSL = 7,00 i pentru TSS s-a obinut media mTSS = 8,53 i mediana MeTSS = 9,50. n acest caz se observ c dei din punct de vedere al mediei cele dou loturi sunt sensibil apropiate, mediana ne aduce o nou informaie: cei din grupul TSL au tendin spre valori mici, pe cnd cei din TSS au o tendin spre valorile mari.

3.7.2. Cuartilele
Cuartilele77 sunt acei indicatori ce mpart datele n patru pri egale. Se poate observa uor c ce-a de-a doua cuartil reprezint de fapt mediana. Pentru a obine cele patru cuartile folosim urmtoarea metod. Calculm nti mediana i rezultatul l vom nota cu Q2. Apoi, pentru datele din stnga lui Q2 calculm mediana i obinem valoarea Q1. Analog pentru datele din dreapta lui Q2 calculm din nou mediana i obinem Q3. Aparent aceast metod pare complicat, dar deoarece exist destul de multe soft-uri ce

88

au o funcie ce poate calcula aceast median78, lucrurile devin destul de simple. Exemplu 58 Mai jos am calculat cuartilele pentru irul de date. Am obinut mediana egal cu 7,00. Ordonm cresctor datele i pentru irul astfel obinut calculm Q1 i Q3:

TSL

4 Q1

10

11

12

13

13

16

16

Q3

Observaie Am calculat mediana pentru un numr par de date i atunci mediana va fi egal cu media valorilor a 15-a i a 16-a. n acest caz cele dou valori sunt egale i valoarea lor este 7, deci i mediana va fi egal cu 7. Pentru calculul medianei primelor 11 date79 mediana va fi numrul de la mijloc adic a aptea valoare. Deci Q1 va fi 4. Analog se va calcula Q3 care va fi egal cu 12.

3.7.3. Valoare modal80

89

Se numete valoare modal a unei serii de numere acea valoare ce apare de mai multe ori n acea serie. Vom nota valoarea modal cu vm. Observaie n general, cnd se folosete termenul de valoare ne gndim la valoarea exprimat prin numere. Aa cum la obiecte exist n afar de valoarea din punct de vedere financiar i alt gen de valori (de exemplu valoarea emoional), i n aceast seciune vom folosi sensul mai larg al termenului de valoare (vezi exemplul 43)

Exemplul 43 (continuare) Se observ c pentru datele Atenie concentrat-cantitate Valori Ponderi 60 1 70 2 80 1 90 11 100 7 avem vm = 90. Observaie Se observ c pentru acest caz avem media egal cu 89,54, iar mediana este Me = 90 = vm.

3.8. Indicatori ai dispersiei


90

Exemplul 59 Un student a realizat un studiu pe elevii dintr-o coal. Pentru a putea trage o concluzie asupra comportamentului copiilor n lotul studiat a luat elevii din clasele a 2-a, a 5-a i a 8-a. De ce ndrumtorul i-a spus s-i modifice modul de alctuire al lotului? n analiza unui grup ne intereseaz tendina grupului privit ca un element. Dac, de exemplu avem un lot de subieci care, n medie, a obinut la un test un anumit punctaj, atunci putem trage o concluzie asupra comportamentului grupului. Exemplul 60 n luna mai s-a aplicat unui grup de elevi din clasa a 8-a, un test de anxietate. Punctajul la acest test este cuprins ntre 0 i 10 unde cu ct punctajul este mai mare cu att anxietatea este mai puternic. n urma prelucrrii datelor media lotului de elevi a fost 6,7. Analiznd media rezult c tendina general este c grupul este n mod esenial normal din punct de vedere al anxietii cu o uoar tendin spre categoria puin nevrotic. n momentul n care ns analizm un grup prin media lui, trebuie s inem cont de faptul c media nu este singura caracteristic a unui lot de subieci i c putem avea aceeai medie la dou loturi i totui analiznd acele loturi s observm diferene importante ntre ele. Uneori, n practic, dei avem aceeai medie pentru dou eantioane, ele sunt diferite din punct de vedere al tendinei81.

91

Pentru a exemplifica, fie urmtoarea situaie: Msurm nlimea populaiei cu vrste ntre un an i 60 de ani n Bucureti. n acest caz obinem o medie a acestui lot de subieci, ns aceast medie nu ar avea nici o relevan din cauza variabilitii mari a valorilor.

3.8.1. Amplitudinea
Amplitudinea este egal cu diferena dintre cea mai mare i cea mai mic valoare. Matematic aceasta se scrie altfel:

A = xmax - xmin

(4)

Exemplul 49(continuare) Nota A Nota A Nota A S1 32 S12 25 S23 22 S2 31 S13 19 S24 25 S3 33 S14 23 S25 21 S4 27 S15 27 S26 25 S5 29 S16 32 S27 25 S6 25 S17 31 S28 19 S7 23 S18 33 S29 23 S8 22 S19 27 S30 27 S9 25 S20 29 S10 21 S21 25 S11 25 S22 23 Avem xmax = 33 i xmin = 19. Deci amplitudinea va fi A = 33 19 = 14.

92

n practic, uneori prin calculul raportului

x max se pot obine x min

mai multe informaii. Acest raport se poate folosi n studiul proceselor dinamice, pentru a afla de cte ori este mai mare valoarea maxim fa de valoarea minim.

3.8.2. Abaterea medie ( Am(a) )


Ne poate interesa distana dintre o valoare calculat i o valoare dat. n termeni statistici rezultatul acestei scderi se va numi abaterea valorii calculate de la valoarea dat. Exemplul 61 Se aplic un test unui pacient nainte i dup aplicarea unu tratament. nainte de tratament a obinut 35 de puncte, iar dup aplicarea tratamentului a obinut valoarea 29. tiind c valoarea critic este 40, calculm abaterea fa de aceast valoare pentru a realiza o prim aprecierea asupra fenomenului. Abaterea82 dintre punctajul obinut nainte de tratament fa de valoarea critic este 5, n timp ce abaterea dintre punctajul obinut dup tratament i valoarea critic este 11, deci exist posibilitatea ca tratamentul s aib un efect pozitiv.

Observaie Am spus c exist posibilitatea ca tratamentul s aib un efect pozitiv n general, deoarece n urma aplicrii unui experiment unui singur subiect, nu putem dect s emitem ipoteze.

93

S presupunem c dorim s studiem mai n amnunt problema pus n exemplul 3.9. Pentru aceasta ar trebui s realizm un studiu pe mai muli subieci. n acest caz notnd cu x1, x2, , xn valorile obinute de pacieni nainte de tratament i cu y1, y2, , yn valorile obinute de pacieni dup tratament. Pentru a compara abaterile fa de valoarea critic o soluie simpl este s calculm o medie a abaterilor nainte de tratament i dup tratament. Aceast medie se numete abaterea medie i se noteaz Am(a)83 Exemplul 62 n urma aplicrii testului pe mai muli subieci nainte i dup tratament s-au obinut urmtoarele rezultate: Nr Inainte Abatere Dup Abaterea subiect de a fa de tratament fa de tratament 40 40 1 35 5 29 11 2 36 4 32 8 3 33 7 32 8 4 30 10 29 11 5 36 4 32 8 6 35 5 33 7 7 29 11 29 11 8 32 8 30 10 Am(40) = 6.75 Am(40) = 9.25 n practic, n cele mai multe cazuri, se calculeaz media abaterilor fa de medie. Exemplul 63

94

S-a studiat variaia anxietii, seara i dimineaa, pe un lot de 10 studeni aflai n sesiunea de examene. O prim parte a acestui experiment a fost msurarea anxietii voalate a studenilor dimineaa. n urma centralizrii datelor s-au obinut rezultatele: anxietate voalat 12 14 20 20 12 16 18 17 15 16 16.00 abaterea fata de medie (x m) 4 2 4 4 4 0 2 1 1 0 2.20

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 medie(m) Observaie

abaterea

Avnd n vedere modul de definire al abaterii, am luat distana dintre valori i medie n modul.

3.8.3. Variana
Un alt indicator al dispersiei ce se folosete n practic este variana. Aceasta se exprim astfel:

95

s2 =

( x1 m) 2 + ( x 2 m) 2 + ... + ( x n m) 2 n 1

(6)

unde m reprezint media valorilor x1, x2, , xn . Aceast formul este valabil pentru eantion. Observaie: Termenul de varian a fost introdus pentru prima oar de Ronald Fisher n 1918 n lucrarea The Correlation Between Relatives on the Supposition of Mendelian Inheritance.

3.8.5. Coeficient de Omogenitate (variabilitate)


n cazul cnd alegem un grup, singura problem este s ne asigurm c acel grup se manifest unitar din punctul de vedere al caracteristicii studiate. Pentru a studia aceasta ne vom raporta la omogenitatea datelor care se calculeaz cu ajutorul coeficientului de variabilitate. Formula este:

CV =

100s % mx

(7)

Avem urmtoarea interpretare:

Dac CV < 10% atunci datele sunt foarte omogene Dac 10% < CV < 20% datele sunt omogene 96

Dac CV > 20% atunci datele nu sunt omogene, deci nu se


comport unitar n raport cu caracteristica studiat i n acest caz fie refacem testarea pentru alt grup, fie msurm o alt caracteristic ce ar putea caracteriza grupul. Exemplul 64 Pe un lot de studeni n sesiune s-a msurat anxietatea voalat dimineaa i seara. n urma centralizrii datelor s-a obinut urmtorul tabel. dimineata seara 21 20 16 17 15 16 24 22 16 18 12 18 23 23 15 16 16 17 18 19 24 26 21 20 13 15 23 22 16 17 14 16 14 15 12 14 19 18 15 16 medie 17.35 18.25 abt std 4.003617 3.09286 CV 23.1% 16.9% Analiznd rezultatele obinute la coeficientul de

97

variabilitate observm c datele obinute dimineaa pentru anxietatea voalat nu sunt omogene (CV > 20%). Deci subiecii, din acest punct de vedere sunt destul de variai. ns seara datele devin omogene (CV < 20%), ceea ce arat c din punct de vedere al anxietii subiecii ajung s reacioneze la fel. Deci am putea concluziona c, n sesiune seara anxietatea voalat caracterizeaz grupul studiat. n cele prezentate n acest capitol pn aici, referirile erau fcute relativ la un grup de subieci. Problema care se pune n cazul acestor analize este s determinm dac concluziile obinute asupra acestui grup se transfer i asupra populaiei din care face parte grupul. De exemplu, concluziile la care am putea ajunge privitor la anxietatea grupului de studeni ar mai fi valabile dac am avea mai muli studeni? Dar dac ne intereseaz s vedem gradul de anxietate al studenilor i s comparm rezultatele obinute dimineaa cu cele obinute seara? Concret, n acest caz avem dou grupuri de studeni un prim grup format din reacia studenilor dimineaa i un al doilea grup format din reacia studenilor seara. Pentru a compara aceste dou grupuri, indicatorii prezentai pn acum nu sunt suficieni. Ceea ce ne va ajuta n acest gen de analize sunt testele statistice. Observaii n cele ce urmeaz se va nelege prin analiza a dou grupuri urmtoarele: 1. un grup s fie populaia, iar al doilea grup s fie un eantion. n aceast situaie ceea ce ne intereseaz este dac eantionul face parte din acea populaie.

98

2. un grup s fie un eantion, iar al doilea grup s un alt eantion. n aceast situaie ceea ce ne intereseaz este dac cele dou eantioane fac parte din aceeai populaie. Faptul c un eantion face parte dintr-o populaie sau c dou eantioane sunt din aceeai populaie reprezint ipoteza de plecare n folosirea testului. Generaliznd putem spune c avem o ipotez nul, deobicei aceasta se noteaz cu H0, n care se presupune c ntre cele dou grupuri nu avem diferene semnificative. Atunci cnd H0 nu este ndeplinit spunem c s-a realizat ipoteza alternativ, notat cu Ha. (eantionul nu face parte din populaie sau cele dou eantioane nu fac parte din aceeai populaie). Bineneles atunci cnd se emite o ipotez trebuie s tim la ce ne ateptm dac ea se verific. Dei pare un lucru evident am inut totui s scriu aceast regul deoarece adeseori studenii n emiterea ipotezelor nu in cont de aceast regul. Pentru a nelege mai bine aceasta dm exemplul de mai jos: Exemplul 65 La susinerea unui proiect un student i alege urmtoarea tem: Influena vrstei asupra anxietii pre i postoperatorii. i-a ales cele dou loturi i a observat c aceast diferen se manifest la brbai nainte de operaie n funcie de vrst. Cnd i s-a pus ntrebarea ce nseamn aceast diferen, studentul nu a tiut ce s rspund.

99

Un alt concept ce ne intereseaz atunci cnd dorim s utilizm un test este nivelul de semnificaie. Acesta ne arat care este probabilitatea de la care evenimentul fenomenul poate fi considerat imposibil. n general apar urmtoarele valori: = 0,05 (sau 5%) = 0,01 (sau 1%) = 0,001 (sau 0,1%)

Altfel spus, de exemplu = 0,05 semnific faptul c maxim 5 cazuri din 100 pot s nu respecte H0, pentru a considera totui c H0 este valabil pentru lotul de 100 de subieci. Nivelul de semnificaie este stabilit de utilizator n funcie de precizia pe care o dorete pentru fenomenul studiat.

3.9. Compararea mediilor


Exemplul 66 un student i propune s studieze dac din punct de vedere al ateniei involutare exist diferene ntre fetele i bieii dintr-o clas a patra. Ce ar trebui s fac pentru aceasta? Exemplul 67 Se poate aplica un test de comparare a mediilor la prelucrarea unui chestionar?

100

Unul dintre matematicienii care s-a ocupat de problema comparrii statistice a mediilor este William Sealy Gosset mai cunoscut sub numele de Student. Patronul fabricii de bere Guiness din Dublin, Claude Guiness avea ca politic a firmei sale angajarea a celor mai buni absolveni de la Universitile din Oxford i Cambridge pentru a aplica n procesele industriale de la Guiness noiuni de biochimie i statistic. W.Gosset a publicat prima lucrare despre testul t n revista Biometrica n 1908 sub pseudonimul Student deoarece n contractul semnat cu fabrica de bere era stipulat c metodele statistice sunt secret de serviciu. De aceea identitatea lui Student nu a fost dezvluit mult vreme pentru a nu fi acuzat de nclcarea clauzelor contractuale.

3.9.1. Compararea mediei unui grup cu o valoare dat


n cele ce urmeaz prin grade de libertate se va nelege valoarea dat de numrul de subieci minus doi. De exemplu dac aplicm un test de comparare a mediilor ntre dou loturi, un lot de 15 subieci i un al doilea lot de 19 subieci atunci gradele de libertate vor date de 15+19-2 = 32. Atunci cnd se aplic un test se obine o valoare calculat care se compar cu o valoare tabelar. Valoarea tabelar depinde de nivelul de semnificaie pe care l alegem i gradele de libertate. Uneori n practic avem nevoie s comparm media obinut prin calcul cu o valoare dat. Concret, ceea ce se poate lua ca ipotez n

101

aceast situaie este dac ntre media grupului i media unei populaii ce are ca medie valoarea dat exist diferene. Exemplul 68 ntr-o coal s-a dat un test la 30 de elevi. Media clasei a fost 7,30. tiind c la nivelul capitalei media obinut a fost 7,20 se pune problema dac media clasei studiate este semnificativ mai mare dect media notelor obinute la nivelul capitalei. Notm cu m media grupului, cu n numrul de subieci din grup, cu v valoarea dat i cu s abaterea medie ptratic a grupului. Atunci valoarea calculat z va fi dat de formula:

z=

m v s n

(8)

Aceast valoare se va compara cu valoarea tabelar i dac z < ztab atunci ipoteza nul este acceptat, adic se poate presupune ca m = v (media grupului este egal cu media populaiei).

3.9.2. Testarea ipotezei privind diferena dintre mediile a dou grupuri cu nr redus de subieci
Pentru a testa ipoteza privind diferena dintre mediile a dou grupuri de volum redus pornim de la presupunerile c avem urmtoarele condiii ndeplinite:

102

cele dou grupuri provin din populaii normal distribuite dispersiile corespunztoare celor dou grupuri sunt egale selecia elementelor unui grup s-a realizat independent de selecia celuilalt grup.

n aceste condiii enumerate mai sus se realizeaz mai nti o aproximare a dispersiei conform urmtoarei formule:
2 ( n1 1 ) 2 s12 + ( n2 1 )s 2 n1 + n2 2

s c2 =

(9)

n aceast situaie, vom avea ipoteza H0: diferena ntre medii este zero. Pentru a verifica aceast ipotez vom calcula:

t calc =

m1 m2 1 1 s c2 + n n 2 1
(10)

Analog cu procedeul de la seciunea 3.9.1. i aici avem o valoare tabelar, ttabel, care se gsete n tabele statistice i depinde de nivelul de semnificaie ales de utilizator i gradele de libertate. Dac tcalc < ttabel atunci este acceptat ipoteza, adic diferenele dintre cele dou medii sunt nesemnificative.

103

Exemplul 69 n urma aplicrii testului Guilford de abiliti ale gndirii divergente (flexibilitatea) la un liceu s-au obinut urmtoarele rezultate: Fete 5 7 8 6 14 11 5 5 5 7 11 11 12 8 7 5 7 7 6 9 7 7 11 3 9 6 7 5 6 13 8 7 8 6 12 5 6 8 12 8 7 16 10 10 16 7 11 14 12 6 7 7 6 Calculnd mediile, obinem la biei valoarea 8,54 iar la fete valoarea 8,07. Problema care ne-o punem este dac diferena de 0,47 este semnificativ. Calculm valoarea tcalc i obinem tcalc = 0,117. Din tabel obinem pentru un nivel de semnificaie de 0,05 o valoare ttabel = 2,007. Cum ttabel > tcalc nseamn c ipoteza nul este acceptat, adic nu avem diferene semnificative ntre fete i biei din punct de vedere al flexibilitii. Adic flexibilitatea la vrsta de 17 ani n liceul studiat nu depinde de sexul subiecilor. Biei

3.10. Testul 2
Exemple unde se poate folosi acest gen de test:

104

Exemplul 70 n anul 2000, cercettorii de la National Opinion Research Center (NORC), de la Universitatea din Chicago au realizat un sondaj pe un eantion de 1768 de persoane (994 femei i 774 brbai). Una din ntrebri sa referit la faptul dac respondenii sunt de acord cu avortul sau nu (indiferent de motiv). n urma centralizrii rezultatelor s-au obinut urmtoarele rezultate: Masculin Feminin De acord 309 396 Nu sunt de acord 465 598 Putem spune c diferenele ntre cele dou loturi sunt nesemnificative sau putem afirma ca femeile sunt ntr-o mai mare msur mpotriva avortului (indiferent de motiv)? Exemplul 71 84 La 31 martie 2003 la nivelul rii 13,60% din persoanele cu handicap erau copii n timp ce persoane adulte cu handicap erau 86,4%. n aceeai perioad n Municipiul Bucureti erau nregistrai 3427 de copii cu handicap i 29.833 de aduli. Difer situaia din Bucureti de cea la nivelul ntregii ri? S presupunem c dorim s facem observaii asupra unor categorii. De exemplu, ntr-un liceu dorim s observm modul n care elevii de clasa a 9-a se acomodeaz cu cerinele liceului. S presupunem c avem: prima categorie - cei care s-au acomodat, a doua cei care au un nivel mediu de acomodare i a treia categorie cei care nu s-au acomodat. n urma unor observaii din anii anteriori avem urmtoarele frecvene: la prima categorie avem m1 elevi, la a doua categorie avem m2

105

elevi, la a treia categorie avem m3 elevi. Problema pe care ne-o punem este dac ntr-un anumit liceu avem cam aceeai distribuie a frecvenelor. Dac vom nota cu x1, x2 i x3 diferenele aprute fa de ceea ce se tia din anii anteriori atunci vom spune c la prima categorie am obinut m1+x1, la a doua categorie am obinut m 2 + x2 i la a treia categorie am obinut m3 + x3. Vom spune atunci c diferenele ntre cele dou distribuii vor mai mici cu ct valorile x i sunt mai mici. R.A. Fisher n lucrarea sa Statistical methods for research workers noteaz cu 2 urmtorul numr
2 x 2 x12 x 2 x2 = + + 3 + ... m m1 m2 m3

2 = Sum

(11)

Se observ c exist o interdependen ntre diminuarea lui x i diminuarea lui 2 (cu ct x este mai mic cu att 2 este mai mic). Deci putem afirma: cu ct 2 este mai mic cu att distribuiile vor mai apropiate. Analog cu testul de comparaie a mediilor i aici avem o ipotez nul: H0 : distribuiile frecvenelor nu difer i o ipotez alternativ: Ha: distribuiile frecvenelor difer semnificativ Aceste ipoteze le vom verifica folosindu-ne de valoarea lui 2. n cele de mai sus am prezentat intuitiv modul de calcul al valorii valoare pe care o vom compara cu o valoare tabelar,
2 tabel 2 calc

, care

depinde de nivelul de semnificaie ales i gradele de libertate. n acest

106

caz gradele de libertate sunt date de: (numrul de categorii 1) x (numrul de loturi observate 1). Deci: dac
2 calc

<

2 tabel

spunem c

se accept ipoteza nul (nu avem diferene semnificative ntre loturile comparate), iar dac
2 calc

>

2 tabel

atunci ipoteza nul este respins i se

accept ipoteza alternativ (avem diferene semnificative ntre loturile comparate).

Exemplul 72 La un sondaj realizat n 2004 pe unui eantion de 1500, printre altele, s-au adresat urmtoarele ntrebri cu variantele de rspuns: 1. Ct ncredere avei n Biseric? a. Foarte mult b. Mult c. Puin d. Foarte puin e. Deloc 2. Ct ncredere avei n armat? a. Foarte mult b. Mult c. Puin d. Foarte puin e. Deloc n urma centralizrii rezultatelor s-a obinut urmtorul tabel:

107

Biserica Armata

F. mult 626 377

Mult 525 694

Puin 201 289


2

F. puin 58 54

Deloc 90 86

total 1500 1500

Calculnd obinem: calc = 232,89. Lund ca nivel de semnificaie 5% i gradele de libertate (5-1)*(22 2 calc > 1) = 4, obinem tabel = 9,49. Deoarece
2 tabel se respinge ipoteza nul i se accept ipoteza

alternativ, adic avem diferene semnificative ntre cele dou distribuii. Observaii:

La aplicarea testului 2 vom lucra cu frecvene absolute, nu frecvene relative (nu procente). Dac dorim s comparm distribuiile a dou eantioane putem considera distribuia unuia ca fiind distribuie teoretic, iar a celuilalt distribuie experimental.

3.11. Coeficientul de corelaie


Exemplul 73 La aplicarea testului pentru identificarea trsturilor accentuate pe un lot de 18 de subieci dependeni de heroin s-au obinut urmtoarele rezultate:

108

Dem Ex I VIII C. M. 83.00 . P. 16.60 75.00 G. C. 33.20 75.00 Ghe. C 24.90 50.00 E. E 8.30 P. A. 41.50 75.00 S. I. 49.80 50.00 R. S. 74.70 100.00 C. D. 16.00 50.00 I. M. 24.90 75.00 V. F. B. 8.30 25.00 C. B. 91.30 75.00 M. D. 33.20 100.00 S. C. B. 8.30 .B. 16.60 75.00 C.A.L. 33.20 25.00 S.D. 33.20 25.00 B.M.C. 24.90 50.00 Aa cum se poate observa din tabel pe coloana n care s-a msurat exaltarea sunt nite date lips. Exist vreo posibilitate de a putea estima aceste date?

Exemplul 74 Un student a venit cu tabelul de mai jos i ma rugat s-l ajut s interpreteze valoarea coeficientului de corelaie pentru cele dou iruri a crui valoare calculat este de -0,38.

109

Atentia voluntara III A Atentia voluntara III B 7 10 10 10 10 5 10 9 10 2 5 10 10 4 10 9 10 5 10 5 10 10 10 5 10 10 10 10 9 10 9 10 10 10 10 10 10 10 5 10 De ce lucrul pe care-l cere acest student nu se poate realiza? Exemplul 75 La un proiect un student are urmtoarele ipoteze de lucru : - cu ct oamenii sunt mai extraveri, cu att asertivitatea lor este mai mare. - cu ct personalitatea de TIP A predomin fa de cea de TIP B, cu att nivelul stresului este mai mare. - dac simptomele psihologice ale stresului sunt mai nsemnate, atunci nivelul stresului este crescut. Poate folosi corelaia pentru a studia aceste trei ipoteze ?

110

Atunci cnd pe un lot de subieci studiem mai multe variabile se pune problema evalurii relaiei dintre aceste variabile chiar dac nu presupunem c ar putea exista o dependen ntre aceste variabile. Problema corelaiei a fost analizat de Galton n urma unui studiu realizat asupra ereditii caracterelor, studiu aprut la mijlocul secolului al 19-lea. O alt lucrare important n cercetarea corelaiei o reprezint studiul realizat de Pearson i Lee, studiu n care au calculat corelaii dintre statur, mrimea palmei i lungimea antebraului. Acest studiu a fost realizat pe un grup de 1401 de familii engleze. Exemplu 76 (Pearson si Lee - modificat) S-a msurat pe un lot de 10 familii statura frailor i surorilor n inci. Dup transformarea n cm se obine urmtorul tabel: nr familiei Sora Frate 1 175 180 2 163 173 3 165 168 4 160 170 5 165 178 6 157 180 7 165 178 8 163 185 9 168 183 10 150 165 n urma calculelor s-a obinut un coeficient de corelaie r = 0,56

111

Ca i la teste, i n cazul coeficientului de corelaie se pune problema de a determina semnificabilitatea. Pentru aceasta lum ca ipotez H0 : variabilele sunt independente, iar ca ipotez alternativ Ha: variabilele sunt dependente. Pentru a verifica H0 trebuie s vedem dac coeficientul de corelaie este 0. Pentru aceasta se calculeaz valoarea tcalc:

t calc =

n 2 1 r2

(12)

Aceast valoare se compar cu valoarea ttab de la testul Student pentru n-2 grade de libertate. La fel ca la comparaia mediilor vom avea:

dac tcalc < ttab atunci diferenele sunt nesemnificative deci putem spune c nu avem corelaie semnificativ ntre cele dou variabile

dac tcalc > ttab atunci diferenele sunt semnificative, deci putem spune c este semnificativ corelaia obinut.

Observaie Avnd n vedere c pentru calculul semnificabilitii corelaiei ttab depinde de numrul de subieci putem observa c o valoare a corelaiei poate fi semnificativ pentru un numr de subieci, dar nesemnificativ pentru un numr mai mic de subieci.

112

Dac n cazul testelor prezentate anterior finalitatea este destul de clar, n cazul coeficientului de corelaie lucrurile nu mai sunt la fel de clare. La ce folosete acest coeficient de corelaie? Pentru a ne apropia de rspunsul la aceast ntrebare amintim cele spuse de R.A. Fisher despre coeficientul de corelaie: n munca experimental locul lui este mai puin central; s-a dovedit a fi util n stadiul explorator al unei cercetri, ca de exemplu cnd doi factori care se presupunea a fi independeni par a fi asociai n apariia lor; dar rareori, n condiii experimentale controlate se dorete ca s exprimm concluziile sub forma unui coeficient de corelaie85. Am dat acest citat pentru a arta grija cu care recomand Fisher folosirea acestui coeficient. Tocmai pentru c este relativ uor de folosit (mai ales atunci cnd folosim un computer pentru prelucrarea datelor) i foarte puternic n da explicaii unor rezultate la care nu se vede rezultatul imediat, recomandm i noi folosirea lui doar ntr-o faz incipient a cercetrii i pentru eventuale validri a unor concluzii la care s-a ajuns folosind i alte instrumente. Una din greelile frecvente ce apar n interpretarea coeficientului de corelaie este ca atunci cnd s-au gsit dou variabile ce se coreleaz s se pun imediat o relaie ntre ele de tip cauz efect. Pentru a nelege mai cele expuse mai sus vom da un exemplu: Exemplul 78 n perioada 1928-1934 s-a realizat un studiu n care s-au msurat n fiecare an numrul celor internai la spitalele psihiatrice i numrul celor care au cumprat aparate de radio. S-a observat c ntre cele dou variabile exista o corelaie foarte bun de 0,94. n mod evident ns nu este vorba de o relaie

113

de cauz efect ntre cele dou fenomene, ba chiar mai mult, nici mcar nu se poate afirma c ntre cele dou variabile exist o legtur real. Normal, la vremea respectiv aparatul de radio era un lucru nou i bineneles c numrul de cumprtori s creasc, ct despre numrul crescut al celor care au fost internai n spitalele de psihiatrie mai degrab situaia politicoeconomic a acelor vremuri s fie cauza real a creterii numrului de pacieni ai spitalelor de psihiatrie. Deci am vzut cum nu trebuie folosit coeficientul de corelaie. Dar ntrebarea pus iniial devine: De ce e nevoie de acest coeficient care nu ajut la gsirea unor motivaii i care, n plus, poate duce i la erori privind dependena aparent a dou variabile? Pentru a rspunde la aceast ntrebare ne vom referi la regresia liniar.

3.12. Regresia liniar


Dac ntr-o populaie avem dou variabile despre care tim c au o corelaie semnificativ, atunci:

cnd creterea uneia implic creterea celeilalte avem corelaie pozitiv cnd creterea unei variabile implic descreterea celeilalte variabile avem corelaie negativ.

114

n oricare din aceste cazuri semnificaia acestui fenomen statistic este c putem exprima o variabil n funcie de cealalt, adic faptul c ar exista o funcie care poate exprima valoarea unei variabile n funcie de cealalt variabil. Din aceast cauz a aprut confuzia legat de ideea de relaie de tip cauz-efect ntre variabilele corelate. n fapt este vorba c exist o variabil uor observabil i n funcie de aceasta putem calcula o alt variabil mai greu observabil. Funcia aceasta se numete regresie. Dac funcia este de forma unei funcii de gradul nti, atunci vom spune c regresia este liniar. Exemplul 79 Pe un grup de 20 de elevi s-a studiat corelaia dintre memoria auditiv i mediile obinute pe semestrul 1. n urma centralizrii datelor s-au obinut urmtoarele rezultate:

115

Memoria auditiv Note 30 6,25 25 9,10 10 5,42 20 7,11 70 9,15 20 5,10 50 8,16 50 6,41 5,30 20 5,32 0 6,33 50 9,15 7,55 30 8,16 50 9,85 75 8,65 4,65 0 6,35 10 5,45 7,56 10 5,12 10 8,14 8,15 20 4,20 10 6,48 Se observ c 5 elevi nu au rspuns la testul pentru memoria auditiv. ntruct coeficientul de corelaie obinut pentru 20 de elevi este 0,638 i este semnificativ putem calcula o funcie de regresie cu ajutorul creia s putem estima scorurile la memoria auditiv pe baza mediilor i pentru elevii care au lipsit atunci cnd a fost aplicat acest test. S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 S13 S14 S15 S16 S17 S18 S19 S20 S21 S22 S23 S24 S25 n exemplul de mai sus, variabila mai uor observabil este variabila note86 i de aceea o putem numi variabil independent, n timp ce variabila cu scorurile obinute de elevi la testul de memorie auditiv,

116

necesit aplicarea unui test i o putem mult mai uor obine prin estimarea cu ajutorul funciei de regresie. De aceea, putem numi variabila scoruri test memorie auditiv, variabil dependent. ns locul acestor variabile se poate schimba. tiind c exist o corelaie semnificativ ntre notele obinute de elevi i scorurile la testul de memorie auditiv putem aplica acest test la nceputul unui semestru i putem estima pe baza lui care ar fi elevii predispui s aib rezultate colare slabe. n acest al doilea caz, variabila scoruri obinute la testul de memorie auditiv devine variabil independent i variabila note devine variabila dependent. Cu ajutorul acestui exemplu am dorit de asemenea s artm i de ce nu este ntotdeauna corect s se analizeze o corelaie ca un indicator al unui fenomen de tip cauz-efect. Un alt rol al corelaiei este i de a putea elimina anumite variabile. S presupunem c ntr-un fenomen studiat intervin mai multe variabile. n statistic este tiut c un numr mai mare de msurtori nseamn n primul rnd pericolul de a avea erori mari de calcul87. Dac dou variabile A i B au o corelaie semnificativ atunci cnd analizm fenomenul respectiv, putem elimina una din ele. De obicei, se elimin variabila care se msoar mai greu. S presupunem c am eliminat variabila B atunci influena acestei variabile n fenomen nu este eliminat, ci apare indirect prin intermediul variabilei A.

3.13. Rezolvarea exerciiilor de nceputul fiecrei seciuni din capitolul 3


117

n capitolul 3 la nceputul fiecrei seciuni am pus nite probleme cu trimitere la ceea ce urmeaz s se discute n acea seciune. n continuare vom prezenta rspunsurile la problemele puse. Desigur n cadrul discuiilor de la seminar se pot gsi i alte soluii la problemele date.

3.13.1. Caracteristici (variabile)


Exemplul 34(rezolvare) Pentru proiectul de diplom un student i-a ales tema: Complexul de inferioritate la adolesceni. Ce ar trebui s cerceteze studentul n cadrul acestui proiect? Deoarece complexul de inferioritate se manifest pregnant prin valene ridicate ale anxietii i depresiei, cercetarea ar putea porni de la aceste dou variabile

Exemplul 35 (rezolvare) La dou clase a V-a din aceeai coal, existau performane colare semnificativ diferite, una din clase avnd rezultate foarte bune, n timp ce la cealalt clas, dei aveau cam aceeai profesori, problema principal a elevilor era s nu rmn corigeni. Pe ce ar trebui s se axeze un eventual studiu de determinare a cauzelor diferenelor ntre performanele colare ale elevilor?

118

Desigur putem avea multe puncte de pornire. O soluie ar fi s se ia ca variabile diferite tipuri de atenie: atenia concentrat, atenia vizual, etc.

3.13.2 Populaie.
Exemplul 39 (rezolvare) Pentru realizarea unui sondaj privitor la alegerile locale dintr-un anumit ora, din cine se compune mulimea pe care o studiem? Dar dac sondajul s-ar referi la alegerile generale? n primul caz populaia va fi alctuit din locuitorii din acel ora cu drept de vot. (practic, ns se vor lua locuitorii care au peste 18 ani). n cazul alegerilor locale populaia se va compune din cetenii cu drept de vot din toat ara. Ca observaie s-ar putea include i cetenii care au 17 ani dac alegerile ar avea loc peste un an.

3.13.3. Eantion. Lot.


Exemplul 42 (rezolvare) O firm dorete s lanseze ntr-un anumit ora un produs i ar dori s afle prerea populaiei din acel ora referitor la produs. Cel mai sigur ar fi s ntrebe pe toi locuitorii din ora, dar costurile i ca timp i financiare ar fi destul de ridicate. Care ar fi soluia pentru a reduce costurile? n acest caz rspunsul este evident: este vorba de a realiza un eantion reprezentativ.

119

3.13.4. Eveniment
Exemplul 45(rezolvare) Un operator trebuie s aplice un chestionar pe teren persoanelor peste 40 de ani de sex masculin. Avnd multe refuzuri, fiind destul de obosit, s-a dus acas unde a rugat nite prieteni s-l ajute completeze chestionarele. Cum s-a modificat evenimentul? Evenimentul iniial se baza pe faptul c cei chestionai aveau vrsta de peste 40 de ani. n condiiile n care cei care completeaz nu ndeplinesc aceast condiie deja avem un alt eveniment ale crui rezultate nu vor reflecta datele evenimentului cerut. n plus mai apare influena indirect a operatorului, dat de faptul c cei care completau fceau parte dintr-o mulime restrns, cea a celor care erau prieteni cu operatorul.

Exemplul 46 (rezolvare) Un student avea ca tem studiul ateniei concentrate la elevii de clasa a 3-a. n urma centralizrii datelor a venit la profesorul ndrumtor cu urmtorul tabel:

120

Subiecti

Atentia concentrata

Varsta

B.B. 70 9 ani T.E. 90 9 ani C.A. 90 9 ani R.I. 100 10 ani S.E. 90 9 ani S.P. 90 10 ani P.V. 90 9 ani L.I. 90 9 ani B.D. 70 10 ani T.C. 90 9 ani B.A. 90 9 ani A.B. 100 7 ani P.F. 90 10 ani B.D. 60 9 ani R.C. 100 9 ani I.V. 80 9 ani C.A. 100 8 ani S.S. 90 13 ani P.A. 100 9 ani N.R. 90 9 ani n urma examinrii acestui tabel, profesorul i spune c trebuie s verifice datele i ca tabelul nu e complet, deci proiectul nu poate fi notat. O prim problem este dat de faptul c atenia concentrat are dou componente: calitativ i cantitativ, i din tabel nu reiese la care din acestea dou s-a referit studentul cnd a realizat tabelul. Apoi n lotul cu care lucreaz apar cel puin dou cazuri ciudate: un elev de 7 ani i unul de 13 ani. Dar s-ar putea ca aceast ultim eroare s fie doar o eroare de tastare. Un factor care nu influeneaz major experimentul este faptul c studentul nu are n coloana a treia numere, ceea ce i va ngreuna calculele n cazul n care ar dori s studieze dac exist vreo legtur ntre vrsta elevilor i scorurile obinute la atenie.

121

3.14.5. Media
Exemplul 50 (rezolvare) n urma aplicrii unui test de memorie pe un lot de copii s-au obinut urmtoarele rezultate: mem vizual mem auditiv 5 6 3 4 2 5 4 6 2 2 2 3 4 5 5 3 6 8 1 2 3 4 Care sunt valorile pentru care am putea spune c un copil are memorie vizual bun n raport cu grupul studiat? Dar memorie auditiv? LM VA MA TC SA TS BR FI DC CR LL Cea mai simpl metod de a afla care copii au memorie vizual bun, este de a calcula media pentru acest lot. n urma calculelor obinem valoarea mediei de 3,27 pentru memoria vizual i 4,36 pentru memoria auditiv. De exemplu despre subiectul FI putem spune c are memorie vizual bun, dar memorie auditiv slab, n timp ce despre subiectul MA putem spune c are memorie vizual slab, dar memorie auditiv bun. Acest gen de analiz este util atunci cnd dorim s monitorizm un subiect n raport cu grupul din care face parte.

Exemplul 51 (rezolvare)

122

ntr-o lucrare cu titlul Legtura dintre mame i copii de 6 ani studentul, la prezentarea lotului pe care a fcut acest studiu a calculat media vrstelor componenilor lotului studiat. Este corect sau nu? Aceasta este una din greelile clasice pe care am putea-o denumi s facem ceva statistic la cercetare. Media vrstelor mamelor ar putea avea o relevan, media copiilor ar trebui s fie foarte aproape de 6 ani, n schimb media obinut punnd la un loc vrstele copiilor i ale mamelor, s zicem c ar fi 18, nu arat absolut nimic, ci reprezint doar un numr ntre vrsta copiilor i vrsta mamelor, numr fr nici o relevan.

3.14.6. Mediana
Exemplul 54(rezolvare) Studenii dintr-o grup au vrut s-i aleag un ef de grup. Pentru c nu au ajuns la un consens, au rugat un profesor s-i ajute n aceast problem. n urma discuiilor avute cu studenii profesorul a determinat 3 candidai pentru aceasta funcie. Apoi a pus pe fiecare student s acorde punctaje ntre 1 i 5 celor 3 candidai. S-au obinut urmtoarele date:

123

S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 S13 S14 S15 S16 S17 S18 S19 S20 S21 S22

S10 1 2 1 2 5 1 5 2 2 5 5 5 2 5 5 2 5 5 2 5 2

S15 3 3 3 4 3 4 3 4 3 1 3 3 4 3 4 3 3 3 3 4 3

S22 5 5 5 5 2 3 2 1 2 2 2 1 2 5 5 2 2 5 2 5 5

media 3.29 3.19 3.24 mediana 2 3 2 Cine credei c este mai indicat s fie ales ef al grupei? Se observ c ntre medii diferenele sunt foarte mici. Desigur s-ar putea alege ca ef de grup s10 pentru c ar avea media cea mai mare 88. Mediana fiind indicatorul prerii subiective a grupului constituie un reper mult mai bun. Deci, avnd n vedere c s15 are pentru median valoarea cea mai mare, profesorul o s recomande ca ef de grup pe s15.

124

3.14.7. Indicatori ai dispersiei Exemplul 59(rezolvare) Un student a realizat un studiu pe elevii dintr-o coal. Pentru a putea trage o concluzie asupra comportamentului copiilor n lotul studiat a luat elevii din clasele a 2-a, a 5-a i a 8-a. De ce ndrumtorul i-a spus s-i modifice modul de alctuire al lotului? n fapt este vorba de o problem ce apare din cauza modului incorect de folosire al variabilei. n general, o variabil este studiat pe un anumit lot dac exist posibilitatea ca ea s caracterizeze ntrun fel acel lot. Deci odat culese datele se va obine o mprtiere foarte mare a datelor. Deci n acest caz se poate realiza un studiu comparativ ntre elevii celor trei ani de studiu.

3.14.8. Compararea mediilor Exemplul 66(rezolvare) Un student i propune s studieze dac din punct de vedere al ateniei involutare exist diferene ntre fetele i bieii dintr-o clas a patra. Ce ar trebui s fac pentru aceasta? Pentru a studia acest lucru studentul trebuie s alctuiasc dou loturi de subieci: unul cu fetele de clasa a patra i altul cu bieii de clasa a patra. Pentru a elimina orice ali factori de influen, trebuie s ia eleve i elevi din aceeai clas (ca s

125

aib aceeai nvtoare).

Exemplul 67(rezolvare) Se poate aplica un test de comparare a mediilor la prelucrarea unui chestionar? n general nu se poate aplica un test de comparare a mediilor la un chestionar. Dar exist posibilitatea unei ntrebri n care se cere subiecilor s dea note pentru a-i exprima opiunea. n acest caz ntrebarea se interpreteaz prin calculul mediei. Deci se poate folosi, n acest caz testul de comparare a mediilor.

3.14.9. Testul 2 Exemplul 70(rezolvare)


n anul 2000, cercettorii de la National Opinion Research Center (NORC), de la Universitatea din Chicago au realizat un sondaj pe un eantion de 1768 de persoane (994 femei i 774 brbai). Una din ntrebri s-a referit la faptul dac respondenii sunt de acord cu avortul sau nu (indiferent de motiv). n urma centralizrii rezultatelor s-au obinut urmtoarele rezultate: Masculin Feminin De acord 309 396 Nu sunt de acord 465 598 Putem spune c diferenele ntre cele dou loturi sunt nesemnificative sau putem afirma ca femeile sunt ntr-o mai mare msur mpotriva avortului (indiferent de motiv)?

126

Dac facem o comparaie direct a datelor am putea crede c femeile sunt mai mare msur mpotriva avortului. Dar dac exprimm datele n procente observm c diferenele sunt nesemnificative: Masculin Feminin

De acord 39.9% 39.8% Nu sunt de acord 60.1% 60.2% O metod mai sigur de a vedea acestea este folosirea testului 2.

Exemplu 71(rezolvare)
La 31 martie 2003 la nivelul rii 13,60% din persoanele cu handicap erau copii n timp ce persoane adulte cu handicap erau 86,4%. n aceeai perioad n Municipiul Bucureti erau nregistrai 3427 de copii cu handicap i 29.833 de aduli. Difer situaia din Bucureti de cea la nivelul ntregii ri?89 Pentru a compara distribuia de la nivelul Municipiului Bucureti cu distribuia pe ar vom transforma in frecvene absolute toate datele i vom obine urmtorul tabel: Copii Aduli Total n Romnia 3427 29833 33260 n Mun. Bucureti 4523 28737 33260 Aplicnd testul 2 se vede c avem diferene semnificative ntre distribuii. Deci am putea spune c la nivelul rii avem un procent mai mare de copii cu handicap de ct n Bucureti raportat la numrul total de persoane cu handicap.

127

3.14.10. Coeficientul de corelaie Exemplul 73(rezolvare)


La aplicarea testului pentru identificarea trsturilor accentuate pe un lot de 18 de subieci dependeni de heroin s-au obinut urmtoarele rezultate: dem exaltare I VIII C. M. 83.00 . P. 16.60 75.00 G. C. 33.20 75.00 Ghe. C 24.90 50.00 E. E 8.30 P. A. 41.50 75.00 S. I. 49.80 50.00 R. S. 74.70 100.00 C. D. 16.00 50.00 I. M. 24.90 75.00 V. F. B. 8.30 25.00 C. B. 91.30 75.00 M. D. 33.20 100.00 S. C. B. 8.30 .B. 16.60 75.00 C.A.L. 33.20 25.00 S.D. 33.20 25.00 B.M.C. 24.90 50.00 Aa cum se poate observa din tabel pe coloana n care s-a msurat exaltarea sunt nite date lips. Exist vreo posibilitate de a putea estima aceste date? Acest exemplu este reluat la partea n care se

128

prezint regresia liniar. Calculnd coeficientul de corelaie pentru datele complete se observ c avem o corelaie semnificativ ceea ce nseamn c putem realiza o estimare a datelor lips cu ajutorul regresiei liniare.

Exemplul 74
Un student a venit cu tabelul de mai jos i m-a rugat s-l ajut s interpreteze valoarea coeficientului de corelaie pentru cele dou iruri a crui valoare calculat este de -0,38. Atentia voluntara III A Atentia voluntara III B 7 10 10 10 10 5 10 9 10 2 5 10 10 4 10 9 10 5 10 5 10 10 10 5 10 10 10 10 9 10 9 10 10 10 10 10 10 10 5 10 De ce lucrul pe care-l cere acest student nu se poate realiza?

129

Acesta este un exemplu de folosire defectuoas a coeficientului de corelaie. Prin definiie acest coeficient ne arat legtura dintre dou caracteristici ale aceluiai grup studiat. Ori n acest caz este vorba de aceeai caracteristic aplicat pe dou grupuri diferite. Ceea ce se poate aplica n acest caz este comparaia mediilor celor dou grupuri.

Exemplul 76
La un proiect un student are urmtoarele ipoteze de lucru : cu ct oamenii sunt mai extraveri, cu att asertivitatea lor este mai mare. cu ct personalitatea de TIP A predomin fa de cea de TIP B, cu att nivelul stresului este mai mare. dac simptomele psihologice ale stresului sunt mai nsemnate, atunci nivelul stresului este crescut. Poate folosi corelaia pentru a studia aceste trei ipoteze ? Ipotezele ce le putem verifica cu ajutorul coeficientului de corelaie sunt cele de forma cu ct ..., cu att. Deci primele dou ipoteze se verific cu ajutorul coeficientului de corelaie. Cea de-a treia ipotez nu este bine formulat deoarece enunul este confuz (mai nsemnate).

130

CAPITOLUL 4: Noiuni introductive despre grafuri i baze de date


4.1. Grafuri
Noiunea de categorie este legat de cea de graf i c odat cu o colecie de obiecte, [trebuie] s fie considerate modalitile de interconectare a obiectelor respective90. De aceea grafurile pot gsi o ilustrare n domeniul social, unde analizarea unui grup nu reprezint doar suma analizelor indivizilor din grup, ci i interaciunea dintre membrii grupului. Este un lucru ndeobte recunoscut c acelai grup poate reaciona ntr-un fel cnd are un lider i altfel cnd are alt lider. Sau, evident, ntr-un mod acioneaz cineva ca lider al unui grup i altfel ca simplu membru al grupului. n acest capitol ne propunem doar s deschidem o u ctre posibilitatea de a folosi grafurile att ca reprezentare a unor fenomene ct i ca un posibil instrument n modelarea unor fenomene sociale. De aceea, ne vom limita la o prezentare intuitiv a unor noiuni legate de teoria grafurilor.

4.1.1. Scurt istoric


n secolul 18 oraul Konigsberg (Kalinigrad de astzi) era traversat de rul Pregel care mprea oraul n patru zone, acestea fiind unite prin 7 poduri. Schematic harta oraului se poate reprezenta astfel:

131

ZONA 1 (A) ZONA 2 (B)

ZONA 3 (C)

ZONA 4 (D)

Locuitorii oraului i-au pus problema dac, n plimbrile pe care le fceau duminic prin ora, este posibil ca pornind dintr-o parte a oraului s poat traversa toate podurile oraului fr a trece de dou ori pe acelai pod i s se ntoarc la punctul de plecare. Problema a fost prima oar rezolvat de matematicianul Leonard Euler. Figura de mai sus se poate pune i sub forma unui graf. Pentru aceasta vom nota zona 1 cu A, zona 2 cu B, zona 3 cu C i zona 4 cu D. Reprezentarea va fi:

132

Relaiile dintre oameni le putem reprezenta cu ajutorul grafurilor.

4.1.2. Definiia unui graf.


Un graf este o structur compus din noduri91 i arce92. Grafurile se pot mpri n urmtoarele dou categorii: grafuri neorientate grafuri orientate

Diferena dintre cele dou tipuri de grafice constnd n faptul c, n timp ce la grafurile neorientate aveam doar noduri unite prin arce, fr a avea un sens de parcurgere ntre noduri, la grafurile orientate avem n plus i un sens de parcurgere ntre noduri. n exemplu prezentat n seciunea 4.1. avem un graf neorientat, unde A, B, C i D sunt noduri, iar liniile care unesc aceste noduri sunt arcele grafului.

Exemplul 32 (continuare) Relum exemplul 32 din capitolul 2. Considernd subiecii ca fiind noduri i interaciunile dintre ei fiind arcele grafului putem reprezenta relaiile dintre ei sub forma unui graf astfel:

133

S5

S2

S1 S4 S3

S8 S6

S7

S9

Se observ c avem n fapt dou grafuri i o prim concluzie ar fi c subiecii S1 i S3 nu interacioneaz n nici un mod cu restul grupului. Acest mod de reprezentare poate releva i alte aspecte ale relaiilor dintr-un grup dect reprezentarea clasic a unei sociograme. Tot la aceast problem putem avea i un alt gen de reprezentare n care facem o reprezentare prin grafuri pentru interaciunile pozitive ntre membrii grupului i o alt reprezentare pentru interaciunile negative n grupul studiat.

134

4.1.4. Clasificarea grafurilor


O alt clasificare a grafurilor este dat de forma lor. Astfel, putem avea urmtoarele tipuri de grafuri: Grafuri simple grafuri n care ntre orice dou noduri avem un unic arc: A B

C ntre Ai C, A i B i B i C avem cte un singur arc Grafuri multiple grafuri n care ntre dou noduri putem avea mai multe arce

135

ntre nodurile A i C i nodurile A i B avem cte dou arce

4.1.5. Arbori O clas special de grafuri orientate sunt arborii. Un graf orientat se numete arbore dac avem un nod distinct numit rdcina arborelui, notat cu n0, astfel nct pentru orice nod din restul arborelui s avem un singur drum care s uneasc acel nod cu n0, nodul-rdcin. Fie urmtorul arbore:

f a n0 d g

De exemplu, de la nodul n0 la nodul g avem drumul: n0 a d g

136

Exemplul 80 Structura unei organizaii poate fi pus sub forma unui arbore:

Director (D)

Dir.adj 1(d1)

Dir.adj 02 (d2)

Dir. economic (de)

A 1

A 2

A 3

A 4

A 5

A 6

A 7

A 8

Pornind de la acest exemplu putem stabili dou tipuri de organizaii: cele de tip arbore, n care ntre orice angajat i director exist un drum unic, aa cum se vede in figura de mai sus. cele de tip graf multiplu n care ntre angajat si director sunt mai multe drumuri ca-n figura de mai jos:

137

Director

Dir.adj 01

Dir.adj 02

Dir. economic

A 1

A 2

A 3

A 4

A 5

A 6

A 7

A 8

De exemplu, ntre director i angajatul A5 avem dou drumuri: director dir. adj. 02 A5 i director dir economic A5.

4.1.5. Proprieti ale grafurilor


Spunem c o relaie este tranzitiv dac din faptul c A este n relaie cu B i B este n relaie cu C rezult c A este n relaie cu C. Aceasta se mai scrie astfel: A(rel)B , B(rel)C A(rel)C

138

Exemplu 80 (continuare) S presupunem c directorul ia o decizie pe care o comunic directorului economic, deci D(rel)de. Apoi directorul economic spune angajatului A7 s se ocupe de ducerea la ndeplinire a deciziei directorului, deci de(rel)A7. n concluzie vom spune ca decizia directorului a fost dus la ndeplinire de angajatul A7, adic D(rel)A7.

Un alt concept al teoriei grafurilor este cel de distan dintre dou noduri. Pentru nceput fie un graf simplu. Atunci numrul de arce dintre dou noduri l definim ca fiind distana dintre cele dou noduri. Trecnd la graful multiplu se pune problema cum definim distana dintre dou noduri avnd n vedere ca n acest caz ntre dou noduri am putea avea mai multe drumuri. n acest caz definim distana dintre dou noduri, notat cu d(x,y), ca fiind cel mai scurt drum ntre nodurile x i y. Deoarece cazul grafului simplu reprezint o particularizare a grafului multiplu putem generaliza definiia drumului pentru orice tip de graf. Exemplul 81

139

Fie structura unei organizaii de tip graf multiplu, ca-n partea a doua a exemplului 4.2. Atunci distana dintre director i A2 este egal cu 2 (d(D,A2) = 2). Dar distana dintre director i A1 este egal cu 1 pentru c n aceast situaie avem dou drumuri unul format din dou arce i unul format dintr-un singur arc.

Director (D)

Dir.adj 01

Dac ntre dou noduri nu exist nici un arc, atunci distana dintre ele se va considera egal cu infinit.

Exemplul 32(continuare) n exemplul cu scrierea unei sociograme sub forma unui graf, se poate vedea c, de exemplu distana dintre S5 i S9 este egal cu 4 n timp ce distana dintre S5 i S1 este . n cazul n care distana dintre dou noduri este infinit spunem c un nod este inabordabil pentru cellalt. n cazul de mai sus vom spune c S1 este inabordabil pentru S5.

140

4.1.6. Alt posibilitate de studiu al relaiilor dintr-un grup de indivizi


n continuare, vom studia anumite relaii dintr-un grup pornind de la conceptul matematic de relaie de echivalen. Pentru nceput s reamintim ce nseamn o relaie de echivalen: Spunem c rel este o relaie de echivalen peste o mulime M dac:

a. A rel A pentru orice A din mulimea M (reflexivitatea) b.


Dac A rel B atunci i B rel A pentru orice A i B din mulimea M (simetria)

c. Dac A rel B i B rel C atunci A rel C (tranzitivitatea)


Mulimea ntre ale crei elemente exist o relaie de echivalen se numete relaie de echivalen. n continuare analizm relaiile dintr-un grup n funcie de cei care execut sarcinile. Definim o relaie a unui grup astfel: spunem c A se afl n relaie cu B dac A ia o decizie i B o execut. Afirmm c legturile ntr-un grup sunt cu att mai puternice cu ct relaia definit mai sus este mai aproape de o relaie de echivalen. Reflexivitatea: n acel grup fiecare are anumite sarcini de care rspunde personal, adic are de executat sarcini n care el ia decizia i tot el execut, adic A rel A Simetria: Dac pentru o parte din sarcini A rspunde i B trebuie s execute ceea ce a decis A, exist sarcini n care B

141

decide i A execut. De exemplu n execuia unui proiect mai mare ntr-o anumit etap A poate fi specialistul, iar n alt etap B poate fi specialistul. Tranzitivitatea: A decide un anumit lucru, B i d seama c nu poate finaliza sarcina dat de A i deleag pe C s finalizeze. Deci n continuare la recomandarea lui B A va lua decizii, iar C le va executa. Desigur toate acestea se petrec ntr-un caz ideal. Dar totui se pot gsi nite cuantificatori prin care se poate msura apropierea de o relaie de echivalen astfel definit. Bineneles c acesta e doar un exemplu i ar putea exista cuantificri mai bune a relaiilor dintr-un anumit grup.

4.1.7. Reprezentarea matriceal a unui graf


Deoarece un grafurile nu sunt doar un mod de reprezentare a unor relaii ntre anumii indivizi, ci ele pot reprezenta un instrument util n modelarea matematic i avnd vedere c astzi orice modelare A B nseamn i introducerea datelor pe calculator se pune problema cum se pot scrie grafurile astfel nct s fie ct mai uor citite de un program pe calculator. Pentru o nelegere mai bun vom lua un exemplu: Fie un graf reprezentat ca mai jos:

142

n primul rnd vom realiza o numerotare a nodurilor. Atunci graful va deveni:

3
Atunci putem avea urmtorul tabel n care pe linie punem nodul de plecare i pe coloan punem nodul n care ajunge arcul. n csuele tabelului vom pune 1 dac avem un arc ntre noduri i 0 dac nu exist un arc ntre noduri. Astfel n csua corespunztoare liniei a doua i coloana nti am pus valoarea 1 pentru c exist un arc de la nodul 2 la nodul 1. Folosind aceeai regul n linia a 3-a i coloana a 4-a am pus valoarea 0 pentru c nu exist nici un arc direct ntre nodurile 3 i 4. n urma completrii obinem urmtorul tabel:

143

1 2 3 4 Dac

1 0 1 1 0 eliminm acum

2 1 0 1 0 prima linie

3 0 0 0 0 i prima

4 0 1 0 0 coloan,

corespunztoare etichetelor vom obine matricea asociat grafului:

0 1 1 0
program pe calculator.

1 0 1 0

0 0 0 0

0 1 0 0

Aceast matrice este uor de folosit pentru realizarea unui

4.2. Baze de date


Fie imediat dup culegerea de pe teren, fie ntre etapele de analiz, datele trebuie stocate, astfel nct s poat fi accesate ct mai uor. De aceea a aprut ca o etap important a cercetrii stocarea datelor ntr-o baz de date. Ce este o baz de date? Putem da o definiie a bazei de date n funcie de facilitile pe care le ofer: Locul unde se pun datele astfel nct s le putem nregistra cu toate informaiile specifice disponibile, s le putem cuta, s le putem extrage dup anumite criterii cerute ntr-o anumit etap a cercetrii. O baz de date poate fi construit ca un tabel n care liniile se numesc nregistrri, iar coloanele se numesc cmpuri.

144

Exemplul 82 Fie o baz de date cu o baterie de 3 teste aplicate la 10 subieci. Aceasta poate fi reprezentat ca un tabel astfel: Test 1 Test 2 Test 3 Subiect 1 12 2 1 Subiect 2 11 5 1 Subiect 3 14 4 4 Subiect 4 15 1 1 Subiect 5 16 5 1 Subiect 6 17 2 2 Subiect 7 12 2 1 Subiect 8 10 4 2 Subiect 9 11 6 1 Subiect 10 15 4 1 n acest caz prin nregistrare se neleg toate informaiile disponibile despre un subiect. De exemplu nregistrarea corespunztoare Subiectului 3 este Subiect 3 14 4 4 Un cmp este dat de valorile corespunztoare unui test. De exemplu, avem cmpul Test 1: Test 1 12 11 14 15 16 17 12 10 11 15 Bazele de date se pot clasifica n baze de date analitice i baze de date operaionale.

145

Bazele de date analitice sunt bazele de date de tip static n care datele sunt sub forma unei liste. Problema cu acestea este cutarea n aceast baz de date care n cazul unor baze de date foarte mari poate deveni foarte anevoioas. Odat cu apariia computerelor a aprut un al doilea tip: bazele de date operaionale. Acest gen de baze de date permit ceva mai mult dect o simpl vizualizare a datelor. Putem realiza o serie de operaii cum ar fi: adugarea de nregistrri, modificarea nregistrrilor, sortarea dup un anumit criteriu, tergerea de nregistrri. Dintre soft-urile n care se pot crea baze de date operaionale amintim: Excel, Microsoft Acces, SPSS.

146

CAPITOLUL 5: Utilizarea Excel i SPSS n statistic

n acest capitol ne-am propus s facem o prezentare succint a principalelor tehnici de utilizare a Excel-ului i a SPSS n calcularea unor indicatori i teste statistice. Desigur nu ne-am propus s facem o prezentare exhaustiv a posibilitilor acestor dou soft-uri n calculele statistice. Pentru cei interesai n a aprofunda aceste dou lucruri, recomandm pentru Excel, de exemplu [ ], iar pentru SPSS [ ]. Acest capitol va fi mprit n dou: n prima parte vom prezenta utilizarea Excel-ului n statistic, iar n partea a doua utilizarea SPSSului n statistic. Prezentarea se va realiza pornind de la exemple concrete. La anumite exemple am modificat n mod intenionat datele pentru a evidenia anumite aspecte ale utilizrii acestor soft-uri.

5.1. Utilizarea Excel n statistic


Excel-ul reprezint un produs al Microsoft dezvoltat pentru sistemele Windows i Macintosh. Un fiier Excel cuprind mai multe foi de calcul. Calculele se pot realiza pe o foaie de calcul, dar se pot realiza legturi ntre foile de lucru ale aceluiai fiier, sau legturi cu foi de lucru din ale fiiere. Amintim c n afar de Excel mai exist i alte soft-

147

uri ce pot realiza sarcini asemntoare cu ale Excel-ului. De exemplu, din pachetul Open Office, avem Open Office Calc. Am optat totui pentru prezentarea Excel-ului deoarece, la ora actual este cel mai rspndit, i n general un utilizator al Excel-ului se poate acomoda relativ rapid cu alte programe ce calcul ce au aprut sau ar putea aprea pe piaa soft-urilor. n continuare vom considera cunoscut n Excel: deschiderea, salvarea unui fiier, elementele meniului, modul n care se specific o anumit celul, introducerea datelor pe o foaie, realizarea celor patru operaii matematice ntre valorile cuprinse n anumite celule din foaia de calcul, copierea formulelor,

5.1.2. Inserarea unei funcii


nainte de a trece la prezentarea funciilor specifice Excel-ului, vom reaminti modul n care se poate insera o funcie n Excel. Pentru a insera o funcie dm un clic pe butonul din meniu ce arat ca mai jos:

148

Dup ce am apsat pe acest buton se va deschide o fereastr de forma urmtoare:

1 o subfereastr

Dac dm clic pe butonul indicat de sgeata 1 se va deschide

149

din care putem selecta tipul de funcie dorit (n situaia de mai sus am selectat opiunea Statistical). Dup selecie n fereastra indicat de sgeata 2 va aprea lista cu funciile corespunztoare acelui tip de funcie. De exemplu pentru a selecta funcia SUM (se va prezenta mai jos aceast funcie) alegem categoria Math & Trig i apoi activm fereastra 2 i dm un clic pe butonul de jos al ruler-ului (marcat cu 3 n figura de mai sus), pn se va vedea n list denumirea SUM. Dm un clic pe denumire i apoi apsm butonul OK. Se va obine fereastra

n primul dreptunghi punem celulele care vor intra n sum. De multe ori s-ar putea ns ca butonul Insert din meniu i din fereastra s nu fie pus n

meniu. Atunci pentru a insera o funcie dm un clic pe opiunea

150

Alegem opiunea Function n cele ce urmeaz vom relua exemplele din capitolul 3 i vom arta cum se pot efectua calculele pentru a obine rezultatele prezentate n acele exemple.

5.1.3. Minim i maxim dintr-un ir de date Exemplul 49(continuare) ntr-un liceu s-a studiat manifestarea complexului de inferioritate la un eantion de 30 de adolesceni. S-a studiat posibilitatea ca s avem o manifestare a complexului de inferioritate prin valene ridicate ale anxietii93. n urma aplicrii testului s-au obinut urmtoarele rezultate:

151

Pentru a calcula minimul i mai apoi maximul acestor date, mai nti le vom pune ntr-o foaie de excel. Dac le-am aranja pe o singur coloan, s-ar putea s nu putem vizualiza pe ecran toate datele. O soluie ar fi punem datele n Excel exact ca-n tabelul de mai sus. Atunci cnd vom selecta tot tabelul i vom calcula cu ajutorul funciilor maximul i minimul acestor date, date de tip caracter vor fi ignorate. n celula B18 vom calcula minimul folosind formula =MIN(A2:D16). Apoi, apsnd pe Enter, vom obine n B18 valoarea 19. Asemntor se va calcula i valorea maxim a datelor folosind n celula B19 formula =MAX(A2:D16). Maximul obinut va fi 33.

152

5.1.4. Media
Exemplul 50(continuare) n urma aplicrii unui test de memorie pe un lot de copii s-au obinut urmtoarele rezultate(datele au fost deja trecut pe o foaie de calcul din Excel)

Pentru a calcula media pentru memoria vizual i memoria auditiv vom folosi formula AVERAGE. De exemplu pentru a calcula media valorilor memoriei vizuale vom scrie n celula B13: =AVERAGE(B2:B12). Rezultatul va fi 3,273. Exemplul 53(continuare) S-a aplicat un test de atenie concentrat la copii din clasa a III-a. n urma testului s-au obinut urmtoarele

153

rezultate:

Reamintim c ponderile reprezint numrul de subieci care au valoarea corespunztoare din stnga. De exemplu cu valoarea 70 avem 2 subieci. Pentru a calcula media n acest caz, trebuie s nmulim respectiv elementele din fiecare coloan. Pentru aceast operaie avem funcia SUMPRODUCT. Pentru a calcula numrul de elemente dintr-un ir de numere vom folosi funcia COUNT. Deci pentru a calcula media ponderat pentru datele din exemplu vom scrie n celula A8 urmtoarea formul: =SUMPRODUCT(A3:A7,B3:B7)/SUM(B3:B7). Rezultatul obinut va fi: 89,545

5.1.5. Mediana
Exemplul 54(continuare)

154

S-au obinut datele de mai sus Pentru a calcula mediana corespunztoare valorilor obinute de S10 vom scrie n B25 urmtoarea formul: =MEDIAN(B2:B23). Rezultatul va fi 2. Asemntor se va obine pentru S15 valoarea medianei egal cu 3, respectiv pentru S22 o valoarea 2.

Exemplele 55 i 56(continuare) La dou echipe de muncitori, echipa A i echipa B, li s-au cerut s noteze cu note ntre 1 i 10 un ef de echip ce a lucrat cu amndou echipele. n urma centralizrii s-au obinut urmtoarele rezultate:

n celula G3 se calculeaz mediana cu formula: =MEDIAN(B2:F2). Rezultatul va fi 3. Asemntor se calculeaz mediana n H5 i se obine valoarea 2,5.

5.1.6. Amplitudinea

Exemplu 49(continuare)
Relum exemplul 5.1. Dorim pentru subiecii de mai jos s calculm amplitudinea.

155
amplit

Pentru aceasta n D18 vom scrie formula: =MAX(B2:D16)-MIN(B2:B16) Dnd Enter vom obine rezultatul 14.

5.1.7. Coeficientul de omogenitate Exemplu 64 (continuare)


Pe un lot de studeni n sesiune s-a msurat anxietatea voalat dimineaa i seara. n urma centralizrii datelor ntr-o foaie de Excel s-a obinut urmtorul tabel:

156

n primul rnd vom calcula media pentru cele dou iruri de date n celulele B22 i C22 cu ajutorul funciei AVERAGE i pentru primul lot vom obine valoarea 17,35 iar pentru al doilea lot vom obine valoarea 18,25. Pentru a calcula abaterea standard vom folosi formula =STDEV(B2:B21) pentru primul lot i =STDEV(C2:C21) pentru al doilea lot. Pentru primul lot vom obine valoarea 4,00 iar pentru al doilea lot vom obine valoarea 3,09. Pentru a calcula coeficientul de omogenitate va trebui s calculm raportul dintre abaterea standard i medie i apoi s-l exprimm n procente. Pentru raport, n celula B24 vom scrie: =B23/B22 i vom obine valoarea 0,2307. Pentru a o transforma n procent dm un clic pe celula B24 apoi un clic pe butonul din meniu. Pentru a

157

obine un procent cu o zecimal vom da mai apoi i un clic pe butonul din meniu. Rezultatul final pentru primul lot va fi 23,1%. Asemntor se va proceda i pentru al doilea lot pentru care vom avea rezultatul 16,9%.

5.1.8. Compararea mediei unui grup cu o valoare dat


Deoarece n capitolul 3, la exemplu 68 nu sunt date toate datele vom da un alt exemplu, pornind de la exemplul 64. Exemplul 64(date modificate) Pe un lot de studeni n sesiune s-a studiat anxietatea voalat seara. n urma centralizrii datelor s-a obinut urmtorul tabel:

tiind din alte cercetri c n mod normal media studenilor n sesiune este de 19 se cere s studieze dac valoarea obinut pe lotul studiat e diferit de valoarea populaiei de studeni obinut n studiile anterioare. Pentru a rezolva aceast problem vom folosi funcia ZTEST. Dm un clic n celula B16 apoi dm un clic pe butonul de funcii i din list alegem

158

funcia ZTEST. Se va deschide o fereastr ca mai jos:

n dreptunghiul Array vom scrie irul de date: B2:B14, n dreptul lui X se va pune valoarea mediei populaiei. Deoarece nu cunoatem valoarea dispersiei populaiei de studeni nu vom completa nimic la Sigma i atunci se va lua valoarea dispersiei lotului de subieci. Dup ce s-au completat spaiile libere obligatorii, se va da un clic pe butonul . Valoarea obinut va fi 0,978.

5.1.9. Testul t
Exemplul 5.9. n urma aplicrii testului Guilford de abiliti ale gndirii divergente (flexibilitatea) la un liceu s-au obinut urmtoarele rezultate:

159

n Excel rezultatul funciei TTEST este eroarea (P-value). Iar pentru a avea diferene semnificative trebuie ca valoarea rezultat n urma aplicrii funciei s fie mai mic dect 0,05. n primul rnd vom da un clic pe celula B15. Selectm din lista de funcii statistice, funcia TTEST i va aprea urmtoarea fereastr:

160

Dm un clic pe dreptunghiul din dreptul etichetei Array1. Scriem acolo celulele n care se gsete primul ir de numere94: A2:B13. Analog n dreptul etichetei Array2 scriem95: C2:E13. La opiunea Tails se pune 1 dac am fcut o presupunere privitor la poziia unei medii fa de cealalt (de exemplu c media fetelor este mai mare dect media obinut de biei), sau punem valoarea 2 dac ipoteza era c cele dou medii sunt diferite fr ns a specifica ce medie este mai mare. Pentru opiunea Type avem trei posibiliti. 1 dac irurile comparate reprezint fizic acelai ir studiat nainte de a aplica un stimul i dup ce am aplicat un stimul. De exemplu, dac studiem depresia la un lot de pacieni nainte de operaie i dup operaie, fizic lotul este acelai i ne intereseaz s vedem dac stimulul (n acest caz operaia) a avut vreo influen asupra pacienilor 2 dac irurile au aceeai dispersie 3 dac irurile au dispersie diferit

161

n cazul prezentat la Tails vom alege opiunea 2, iar la opiunea Type alegem opiunea 3. Rezultatul final va fi: 0,573 deci eroarea este mai mare de 0,05 adic nu avem diferene semnificative ntre cele dou medii. Se observ c pentru folosirea funciei TTEST nu avem nevoie s calculm mediile celor dou loturi. Acestea trebuie calculate separat atunci cnd, n cazul diferenelor semnificative dorim s reprezentm grafic mediile comparate.

5.1.10. Testul 2
Exemplul 72(continuare) La un sondaj realizat n 2004 pe unui eantion de 1500, printre altele, s-au adresat urmtoarele ntrebri cu variantele de rspuns:
3.Ct ncredere avei n Biseric? a. Foarte mult b. Mult c. Puin d. Foarte puin e. Deloc 4.Ct ncredere armat? a. Foarte mult b. Mult c. Puin d. Foarte puin e. Deloc avei n

n urma centralizrii rezultatelor s-a obinut urmtorul tabel:

Pentru a vedea dac avem diferene

162

semnificative ntre cele dou distribuii vom folosi funcia CHITEST. Dm un clic n celula B5 i apoi selectm din lista cu funcii statistice funcia CHITEST. Va aprea urmtoarea fereastr:

Dac studiem c a doua distribuie difer semnificativ sau nu de prima distribuie, atunci la Actual_range vom scrie B2:F2 iar la Expected_range vom scrie B3:F3. (reamintim c pentru a compara dou distribuii vom lucra cu frecvene absolute i ca suma frecvenelor de la prima distribuie trebuie s fie egal cu suma de la a doua distribuie). Dup ce vom da un clic pe butonul n celula B5 va aprea rezultatul 3.14879E-49. Aceasta este o scriere matematic a numrului zecimal subunitar ce are 48 de zecimale egale cu zero iar a 49-a zecimal este 3 i a 50-a este 1, etc. Deci este evident ca numrul obinut este mai mic de 0,05 deci ntre cele dou distribuii avem diferene semnificative. O alt posibilitate de a analiza numrul obinut este s dom un clic pe celula B5 i apoi dm un clic pe butonul , i atunci va aprea n celula B5 valoarea 0%. Cum 0,05 se mai poate scrie 5% vom compara valoarea obinut cu ajutorul funciei cu 5%. Cum valoarea este mai mic dect 5%, putem spune c avem diferene semnificative ntre distribuii.

5.1.11. Coeficientul de corelaie 163

Exemplu 73 (Pearson si Lee) S-a msurat pe un lot de 11 familii statura frailor i surorilor n inci. Dup transformarea n cm se obine urmtorul tabel:

S se studieze coeficientul de corelaie ntre irul de date corespunztor sorei i irul de date corespunztor fratelui. n acest caz vom folosi funcia CORREL. O vom selecta din lista funciilor statistice i vom obine fereastra:

La Array1 vom scrie B2:L2, iar la Array2 scrie B3:L3. Coeficientul de corelaie va fi 0,6333. Pentru a verifica semnificabilitatea coeficientului de corelaie va trebui s calculm valorea t asociat coeficientului. Reamintim formula:

t calc = 164

r n 2 1 r2

n B5 avem valoarea coeficientului de corelaie, iar n C5 scriem numrul de nregistrri adic valoarea 11. n B6 vom calcula valoarea lui t cu formula: =B5*sqrt(C5-2)/sqrt(1-B5^2). Vom obine valoarea 2,4547. Pentru a obine valoarea t din tabel vom folosi funcia TINV pe care o vom alege tot din lista funciilor statistice. Se va deschide fereastra:

n dreptul opiunii Probability se va pune nivelul de semnificabilitate, adic 0,0596, iar n dreptul gradelor de libertate se va pune valoarea lui n-2, adic n cazul nostru 997. Dup ce vom da un clic pe butonul OK, vom obine valoarea 2,2622. Deoarece valoarea calculat este mai mare dect valoarea din tabel rezult c avem o corelaie semnificativ ntre cele dou iruri de numere.

5.1.12. Regresia liniar Exemplul 79 Pe un grup de 20 de elevi s-a studiat corelaia dintre memoria auditiv i mediile obinute pe semestrul 1. n urma centralizrii datelor s-au obinut urmtoarele rezultate.

165

Se cere s se estimeze cele 5 rezultate lips. Pentru aceasta aezm ntr-un tabel doar rezultatele corespunztoare subiecilor crora li s-au aplicat testul de memorie auditiv.

166

Calculm coeficientul de corelaie pentru noile date i obinem valoarea 0,638. Facnd verificrile ca n exemplul anterior rezult c avem corelaie semnificativ. Vom considera variabila Memoria auditiv, ca fiind variabil dependent i variabila Note ca fiind variabila independent. Deci putem calcula regresia liniar de forma y = a.x + b, unde x reprezint variabila Note, iar y reprezint variabila Memoria auditiv. Pentru a calcula pe a, numit i panta regresiei, vom folosi funcia SLOPE. Dm un clic pe celula B25 i, dup ce selectm aceast funcie din lista funciilor statistice, va aprea urmtoarea fereastr:

167

n conformitate cu conveniile stabilite anterior, la dreptunghiul din dreptul etichetei Known_ys vom scrie B2:B21, iar la Known_xs vom scrie C2:C21. Dm un clic pe butonul i vom obine n celula B25 valoarea 8,469. Pentru a afla valoarea lui b, termenul liber, vom folosi funcia INTERCEPT pe care o gsim tot n lista cu funcii statistice. Folosind un procedeu asemntor cu cel de la funcia SLOPE, vom obine valoarea -31,239. Pentru a estima valorile lips din tabel este suficient s calculm pentru S9, n celula B10 din primul tabel valoarea expresiei: =B25*C10+B26 i vom obine valoarea estimat pentru S9 egal cu 13,645.

5.1.13. Tabel funcii excel pentru calcule statistice


Prin Celinc vom nelege celula de la nceputul irului de date cruia dorim s-i aplicm funcia, iar prin Celfin vom nelege celula de la finalul irului de date cruia dorim s-i aplicm funcia

168

Denumire funcie Maxim

Forma funciei =MAX(Celinc:Celfin)

Unde se poate folosi funcia Calcularea maximului unui ir de numere Calcularea minimului unui ir de numere Calculeaz media unui ir de numere

Minim

=MIN(Celinc:Celfin)

Media

=AVERAGE(Celinc:Celfin)

Media ponderat Mediana

=SUMPRODUCT(Celinc1:Celfin1,Celinc2: Calculeaz media Celfin2)/ SUM(Celinc2:Celfin2) ponderat =MEDIAN(Celinc:Celfin) Calculeaz mediana unui ir de numere Calculeaz amplitudinea unui ir de date

Amplitudinea =MAX(Celinc:Celfin)-MIN(Celinc:Celfin)

Coeficient de =STDEV(Celinc:Celfin)/AVERAGE(Celinc: Calculeaz omogenitatea omogenitate Celfin) unui ir de date Testul Z =ZTEST(Celinc:Celfin, medpop) Calculeaz eroarea pentru compararea mediei unui grup cu o valoare dat

Testul t

=TTEST(Celinc1:Celfin1,Celinc2:Celfin2,v Calculeaz eroarea pentru altails, valtype) a compara mediilor dintre dou grupuri de subieci Calculeaz eroarea pentru a compara diferenele ntre dou distribuii Calculeaz coeficientul de corelaie ntre dou

Testul 2 (hi- =CHITEST(Celinc1:Celfin1, ptrat) Celinc2:Celfin2)

Coeficientul de corelaie

=CORREL(Celinc1:Celfin1, Celinc2:Celfin2)

169

variabile Valoarea =TINV(ns,gl) tabelar a lui t Calculeaz valoarea tabelar a lui t n funcie de nivelul de semnificabilitate (ns) i gradele de libertate (gl)

5.2. Utilizarea SPSS


Atunci cnd se vorbete despre cercetarea n sociologie i psihologie mai ntotdeauna se amintete de prelucrarea datelor cu ajutorul SPSS-ului. Ce este SPSS-ul? Denumirea provine din englez (Statistical Package for the Social Sciences) ceea ce s-ar traduce prin pachet statistic pentru tiinele sociale. nainte de ncepe propriu-zis prezentarea acestui pachet de programe, a dori s atrag atenia asupra anumitor aspecte - n acest capitol voi realiza o introducere la un nivel de baz a SPSS-ului. - pentru o nelegere mai bun a SPSS-ului se recomand reluarea unor noiuni de statistic98 - trebuie s nelegei c acest capitol acoper doar o parte din lucrurile ce se pot realiza cu SPSS-ul. De aceea, dup ce vei nelege bine noiunile predate, recomandm s ncercai i alte metode statistice ale acestui program.

170

5.2.1. Ferestre i fiiere n SPSS


n SPSS vei avea ocazia s lucrai cu trei tipuri de ferestre, avnd posibilitatea s salvai coninutul fiecrei ferestre 1 - prima fereastr pe care o vei ntlni, va fi fereastra Data Editor99. Are rolul de a defini i introduce datele i, n acelai timp de a ajuta la realizarea unor proceduri statistice. 2 - fereastra Output100 - are rolul de a afia rezultatele testelor statistice. 3 - fereastra Syntax - are rolul de a memora operaiile realizate asupra datelor. Aceasta fereastr se va deschide automat atunci cnd vei da comanda Paste. Oricare din aceste ferestre poate fi salvat. Pentru a executa aceast comand trebuie mai nti activat fereastra ce dorim s-o salvm, apoi se execut o succesiune de comenzi asemntoare cu salvarea unui document Word. Aa cum la salvarea unui document n Word, acesta va primi automat extensia .doc, la fel i aici fiecare fereastr dup scrierea numelui dat va avea i o extensie cu ajutorul creia putem s tim ce tip de fereastr avem. n tabelul de mai jos prezentm ferestrele i extensiile corespunztoare: Numele ferestrei Editor Output Syntax Extensia fiierului salvat .sav .spo .sps

5.2.2. Introducerea datelor 171

n lucrul cu SPSS-ul avem dou moduri de introducere a datelor: de la tastatur sau dintr-un program cu foi de lucru 101. n cadrul acestei lucrri ne vom referi la primul mod de lucru. Deschiznd sesiunea de lucru cu SPSS pentru Windows, pe ecran va aprea o fereastr n care vom fi ntrebai n legtur cu ceea ce dorim s realizm:

Avnd n vedere denumirea seciunii, vom alege opiunea de introducere de date noi 102 dup care vom da un clic pe butonul OK. Atunci fereastra de dialog va disprea i va rmne o foaie gen Excel n care putem introduce datele. Singura diferen este c n aceast

172

fereastr coloanele nu sunt notate cu litere ci la fiecare coloan avem aceeai etichet var. Datele se introduc de la tastatur i dup scriere se apas tasta Enter. Atunci cnd vom completa acest tabel, la ca i n fel Excel, atunci cnd introducem datele trebuie s punem pe fiecare linie cte un caz (de exemplu atunci cnd dorim s analizm un lot de 31 de subieci, fiecare subiect va fi pus pe o linie cu toate caracteristicile lui) i pe fiecare coloan caracteristicile corespunztoare fiecrui caz (n exemplu de dinainte, dac dorim s realizm un studiu n funcie de vrst, mediu, ocupaie, etc. atunci vom avea o coloan pentru vrst, una pentru mediu, alta pentru ocupaie,etc.). De asemenea se recomand ca pentru fiecrui subiect s-i atribuim un numr 103. Pentru identificarea sexului subiecilor se poate atribui valoarea 1 pentru masculin i 2 pentru feminin.

5.2.3. Crearea unui fiier de date


n aceast seciune vom prezenta modul de realizare a unui fiier de date pas cu pas. Precizm c operaiile pe care le vom prezenta sunt specifice versiunii SPSS 14.0 n versiuni anterioare procedeul diferind la anumite etape de creare a fiierului de date. n fereastra n care am introdus datele, n partea de stnga jos avem dou butoane: c am introdus urmtoarele date: . Implicit este activ cel cu

Data View, adic fereastra unde se introduc datele. S presupunem

173

Pentru a defini baza de date va trebui s specificm pentru fiecare coloan tipul datelor. Pentru aceasta vom da un clic pe butonul . Va aprea o nou fereastr:

174

n prima coloan avem eticheta Name. Aceasta reprezint lista etichetelor ce apar n foaia Data View pentru fiecare coloan. Prima coloan din baza de date este cea cu etichetele pe care le-am dat fiecrui subiect. Deci vom denumi aceasta coloan Etichete. Pentru aceasta vom da un clic pe VAR00001 i de la tastatur vom scrie Etichete, dup ce vom da Enter n locul lui VAR00001 va aprea denumirea Etichete. n urmtoarea celul din dreapta trebuie s definim tipul datelor ce se vor introduce pe coloana Etichete. Deoarece datele introduse n acea coloan conin litere, automat este aleas opiunea String. Deci putem lsa opinea neschimbat. La opiunea Width se specific numrul maxim de caractere ce se pot avea datele din aceste coloane. Implicit a fost aleas valoarea 2, dou

175

caractere, deoarece din datele introduse nu avem dect etichete de dou caractere. Dac dorim s schimbm i s putem introduce date de lungime mai mare, dm un clic pe valoarea 2 i scriem de la tastatur numrul 8. Pe liniile urmtoare vom scrie la etichete test 1, respectiv test 2 i lsm neschimbate celelalte opiuni. Vom obine fereastra:

iar dac dm un clic pe butonul

vom obine fereastra:

Ca un rezumat al celor explicate mai sus vom da un tabel cu proprietile ce se pot specifica n legtur cu fiecare coloan: Tipul de comand Type permite definirea tipului variabilei (numeric, ir de numere, logic) Width total numere de caractere Valoarea implicit 8

176

Decimals (n cazul datelor numerice) numrul de zecimale cu care dorim s scriem numrul Missing Values permite desemnarea anumitor scoruri ce pot lipsi la colectarea datelor Colums permite schimbarea maximului de caractere dintr-o coloan Align permite desemnarea alinierii ntr-o coloan Measure permite desemnarea tipului de date cu care lucrm104

8 dreapta scale

n continuare vom salva aceast baz de date. Salvarea se realizeaz asemntor cu modul n care se realizeaz salvarea n Excel, adic dm un clic pe opiunea File, apoi din lista ce va aprea vom selecta opiunea Save. Cnd salvm prima oar va trebui s indicm locul unde salvm baza de date i denumirea bazei de date. S presupunem c am salvat aceasta baza de date cu denumirea Baza_d_01. La salvarea bazei de date putem da o opiune de salvare a bazei de date ca fiier din alt program, de exemplu Excel.

5.2.4. Statistica descriptiv a bazei de date


Odat realizat baza de date corect putem obine o serie de informaii utile din aceste date. Un prim lucru pe care-l putem obine este o statistic descriptiv a datelor (numr, medie, abatere standart). Pentru aceasta deschidem baza de date (n fereastra ce apare cnd deschidem SPSS-ul alegem opiunea Open an existing data source.

177

Iar din lista de baze de date alegem baza_d_01.sav. Se va deschide fereastra cu baza de date i din meniul acestei ferestre vom da un clic pe opiunea Analyze, apoi pe Descriptive statistics i apoi vom da un clic pe opiunea Descriptives ca n imaginea de mai jos

Se va deschide fereastra de mai jos:

178

S presupunem c dorim s obinem statistica descriptiv pentru datele de la testul 01. Dm un clic pe Test01 apoi un clic pe butonul dup care n fereastra denumit Variables(s) va aprea scris Tes01 i butonul irului numit Test01 se va activa. Dnd clic pe acest buton vom

obine fereastra cu datele statisticii descriptive referitoare la datele

179

Rezultatele se pot salva sau se pot tipri urmnd aceleai operaii ca la salvarea unui document n Word.

5.2.5. Corelaia
S deschidem din nou baza de date, aa cum am prezentat la nceputul seciunii 5.2.4. Dorim s calculm coeficientul de corelaie dintre cele dou teste din baza de date. Pentru aceasta din meniu vom selecta opiunea Analyse, apoi Correlate i vom merge pe opiunea Bivariate ca n imaginea de mai jos:

Dup ce vom da clic pe opiunea Bivariate va aprea fereastra:

180

Dm un clic pe Test01 i apoi pe

, procednd analog cu

Test02. n final cele dou vor aprea pe fereastra din dreapta, butonul OK va deveni activ. Verificm s avem bifat opiunea Pearson din fereastr

i opiunea Two-tailed care se afl pe fereastr mai jos. Apoi dm un clic pe butonul . Vor aprea rezultatele:

181

n partea dreapt a ferestrei vom avea afiate rezultatele. Coeficientul de corelaie, Pearson Correlation, are valoarea -0,475 iar eroarea p = 0,419. Ca s avem un coeficient de corelaie semnificativ ar trebui ca p < 0,05 i cum p-ul obinut p = 0,419 > 0,05 rezult c ntre cele dou teste nu exist o corelaie semnificativ.

5.2.6. Comparaia ntre mediile a dou loturi


n exemplul folosit n seciunile anterioare nu se poate folosi comparaia ntre medii, deci vom realiza o alt baz de date. S presupunem c pe dou loturi de subieci aplicm un test Test03. Pentru claritatea expunerii s presupunem c loturile sunt formate din doar 10 subieci fiecare.

182

Exemplul 86 n urma aplicrii testului Guilford de abiliti ale gndirii divergente (flexibilitatea) la un liceu s-au obinut urmtoarele rezultate: Biei Fete 5 6 11 5 11 5 8 6 7 3 6 6 13 8 6 6 8 7 11 8 De cele mai multe ori erorile apar de la introducerea datelor. Influenai de modul n care se introduc datele n Excel exist tendina de a le pune n acelai mod n baza de date din SPSS. Fiind vorba de o baz de date, punerea pe aceeai linie a valorilor unui biat cu valoarea unei fete (de exemplu pentru primele 2 valori la biei 5 i la fete 6) ar putea da impresia c ntre biatul i fata care sunt pe o linie ar putea s existe o legtur. De fapt, avem 20 de subieci care nu au legtur unul cu altul, loturile sunt independente, i pentru fiecare subiect n baza de date specificm, sexul i valoarea obinut la test. De aceea, n baza de date din SPSS, pe prima coloana vom avea declaraia sexului subiectului, iar pe a doua coloan vom pune valoarea obinut la testul Guilford. n acelai timp vom realiza i o codificare: vom nota cu m bieii i cu f fetele. Deci n foaia de declaraie a variabilelor vom scrie ca n figura de mai jos:

183

La variabila val_test am pus n dreptul coloanei Label eticheta Guilford pentru ca pe tabelul cu rezultate s apar i denumirea testului folosit. Apoi n foaia Data View vom introduce datele astfel nct pe coloana denumit Sex s avem m sau f corespunztoare bieilor, respectiv fetelor. n urma completrii vom obine urmtorul tabel:

184

Deci pn la linia a 10-a inclusiv am introdus valorile corespunztoare bieilor, iar din linia a 11-a la linia a 20-a am introdus valorile fetelor. Pentru a calcula testul t pentru loturi independente vom da un clic pe opiunea Analyze din meniu, apoi pe Compare Means, iar din fereastra ce se va deschide vom da un clic pe opiunea Independent-Samples T Test. Dup executarea acestei succesiuni de comenzi va aprea o fereastr ca-n imaginea de mai jos:

Variabila sex va fi trecut la Grouping Variable, iar variabila Guilford (val_test) va fi trecut la Test Variable(s). Mai apoi trebuie sa precizm notaiile pentru grupuri. Pentru aceasta vom da un clic pe butonul i se va deschide fereastra:

185

n dreptunghiul corespunztor lui Group 1 vom scrie m, iar n cellalt dreptunghi vom scrie f. Atunci butonul Continue va deveni activ. Dm un clic pe el i n dreptul variabilei sex va aprea scris (m f). Acum putem da comanda de calcularea testului t i dnd un clic pe butonul OK va aprea urmtoarea fereastr de rezultate:

Se observ c se realizeaz n partea de sus a ferestrei o statistic descriptiv a datelor n tabelul denumit Group Statistics, iar rezultatele testului vor fi puse n tabelul denumit Independent Samples Variables. Tabelul are trei mari pri: n prima parte sunt puse etichetele

186

n a doua parte se calculeaz un testul pentru studiul egalitii varianelor:

Pe exemplul prezentat am obinut valoarea F = 6,946 i o valoare p = 0,017. Deoarece p < 0,05 se poate presupune c cele dou loturi au variane egale. n cea de-a treia parte se dau datele rezultate direct din aplicarea testului t:

187

Avnd n vedere rezultatul testului de comparare a varianelor, vom lua n considerare doar rezultatele de pe prima linie. n prima coloan avem valoarea t = 2,654, n a doua coloan avem gradele de libertate df = 18, n a treia coloan avem valoarea p = 0,016. Pentru ca p < 0,05 nseamn c avem diferene semnificative ntre medii celor dou loturi, deci putem spune c media bieilor mb = 8,60 este semnificativ mai mare ca media fetelor mf = 6,00.

5.2.7. Testul 2 (hi-ptrat)105


n seciunea 5.2. am vzut c modul de a completa o baz de date n SPSS este diferit de modul n care aceste date se pun ntr-o foaie de lucru, de exemplu n Excel. Ideea de baz este nregistrarea i faptul c pe fiecare linie trebuie pus cte o nregistrare cu toate componentele ei ce vor fi folosite n analiza datelor. Dac n cazul exemplului din seciunea anterioar aveam pentru fiecare subiect de pus sexul i

188

valoarea testului. n cazul aplicrii testului hi-ptrat n SPSS avem de fcut trei declaraii. Pentru claritatea expunerii vom folosi un exemplu:

Exemplul 87
ntr-un centru de reeducare s-a pus bieilor urmtoarea ntrebare: Din ce cauz nu-i place coala? n urma centralizrii datelor s-au obinut urmtoarele rezultate: 16-17 ani 18-22 ani mi este greu s nv 1 4 m plictisesc 18 11 m enerveaz profesorii 7 1 nu-mi folosete 10 19 Dorim s studiem dac exist diferene semnificative ntre cele dou loturi de subieci. Pentru nceput vom completa foaia cu Variable View a bazei de date din SPSS. Vom avea trei tipuri de caracteristici: Grup_vrst, var_rspuns i frecvene . Vom face i urmtoarele codificri:
Grup vrst Denumire categorie Codificare 16-17 ani 1 18-22 de ani 2 Variante de rspuns Denumire categorie Codificare mi este greu s nv 1 m plictisesc 2 m enerveaz profesorii 3 nu-mi folosete 4

Deschidem Data editor i definim mai nti baza de date n foaia Variable View. Pentru ca n tabelul cu rezultate s apar i denumirile nu doar codurile n tabelul de declaraii n coloana Values vom scrie i

189

etichetele corespunztoare codurilor. De exemplu pentru categoria Grup vrst dm un clic pe celula din dreptul liniei categoriei i coloana Values. Atunci n dreapta celulei va aprea butonul acest buton i va aprea fereastra: . Dm un clic pe

n dreptul lui Value vom scrie codul, iar n dreptul Label vom scrie denumirea. Apoi dm un clic pe butonul . Iar codul i

eticheta vor aprea n dreptunghiul de mai jos. Astfel introducem toate codificrile i etichetele corespunztoare categoriei Grup_varsta106. Analog se vor introduce i codificrile pentru var_raspuns. n final, tabelul Variable View va arta astfel:

190

Dm un clic pe Data View pentru a introduce datele. Datele se vor introduce asemntor cu modul n care le-am introdus la testul t:

191

Urmtoarea procedur ce trebuie realizat este ponderarea celulelor. Pentru a realiza aceasta, dm un clic pe opiunea Data din meniu, iar din fereastra ce se va deschide alegem opiunea Weight Cases107. Va aprea fereastra:

n aceast fereastr dm un clic pe opiunea Weight cases by, se va activa butonul de la Frequency Variable. Dm un clic pe pentru a specifica coloana unde sunt . Odat specificat

Frecvene i apoi pe butonul

frecvenele. Apoi dm un clic pe butonul

faptul c lucrm cu frecvene putem trece la calcularea efectiv a testului 2. Dm un clic pe opiunea Analyse din meniu i din fereastra ce se va deschide alegem opiunea Descriptive Statistics. Din noua fereastr ce se va deschide vom alege opiunea Crosstabs. Va aprea urmtoarea fereastr:

192

Variabila Grup_varsta o vom pune la Row(s) dnd un clic pe butonul , iar variabila Var_raspuns o vom pune la Column(s). Apoi i fereastra:

dm un clic pe butonul

193

vom da un clic pe Chi-square pentru a specifica faptul c vom utiliza testul 2, apoi dm un clic pe butonul pentru a reveni la

fereastra iniial. n fereastra iniial vom da un clic pe butonul iar n fereastra ce se va deschide:

dm un clic pe opiunea Expected i pe Unstandardized apoi pe butonul . Revenii la fereastra iniial, dm un clic pe butonul pentru calcularea rezultatelor testului 2. n fereastra cu rezultate vor aprea trei tabele. Primul tabel

194

ne indic nite parametri generali a datelor introduse n tabel. Al doilea tabel:

ne red tabelul cu valori. n dreptul liniei denumit Residual se calculeaz diferena dintre cele dou frecvene ale celor dou grupuri corespunztoare unei variante de rspuns. De exemplu la opiunea imi este greu sa invat la grupul de 16-17 ani la Residual se observ valoarea -1.5. Aceasta ne arat faptul c pentru aceast variant de rspuns cei din categoria 16-17 ani au mai puine opiuni dect cei de la categoria 18-22 de ani. Al treilea tabel:

195

ne d ceea ce rezult n urma aplicrii testului 2. Valoarea 2calc este108 10,771 gradele de libertate109 sunt 3. Valoarea p = 0,013 i cum ea este mai mic de 0,05 nseamn c avem diferene semnificative ntre cele dou grupuri, deci putem spune c cei de 16-17 ani au dat rspunsuri semnificativ diferite de cei de 18-22 de ani. Se poate observa faptul c sub acest tabel ni se atrage atenia c avem 4 celule (50% din date) cu o frecven foarte mic. i n continuare se specific faptul c minimum pentru frecven este 2,46 (deci frecvena minim recomandat este 3).

5.2.8. Coeficientul alpha


Atunci cnd se aplic un instrument ce conine mai muli itemi una din problemele ce apar este de a studia dac itemii tind s msoare acelai lucru. Exist mai multe metode de a rezolva aceast problem, dintre acestea amintim: folosirea coeficientului alpha, metoda split-half,

196

etc. n aceast seciune vom prezenta un mod de calculare a coeficientului alpha. Cu ajutorul coeficientului alpha se pot rezolva o palet mai larg de probleme. Dintre acestea amintim: Scurtarea unui chestionar prin meninerea sau mbuntirea validitii interne Msurarea concordanei dintre doi evaluatori diferii Studiul consistenei unei msuri luate att la testare ct i la retestare n cele ce urmeaz vom da un exemplu de calcul al unui coeficient specific SPSS-ului. S presupunem c avem 8 persoane110 ce rspund la trei itemi. n primul rnd trebuie s definim cmpurile bazei de date. n prima coloan vom trece iniialele subiecilor, deci vom defini aceast coloan ca fiind de tip String, iar celelalte coloane ce vor conine valorile obinute pentru fiecare item vor fi de tip Numeric de mrime 2 i fr zecimale. Dup ce am completat aceste date vom obine o foaie ca-n figura de mai jos:

197

Dm apoi un clic pe Data View i introducem datele ce au reieit din aplicarea testelor. Va rezulta o foaie ca-n figura de mai jos:

Pentru a stabili fidelitatea itemilor, prin metoda coeficientului alpha, selectm din meniu opiunea Analyse, iar n fereastra ce se va deschide dm un clic pe opiunea Scale i apoi pe Reliability Analysis. Se va deschide fereastra:

198

Trecem cei trei itemi n fereastra din dreapta cu ajutorul butonului fereastra dup care dm un clic pe butonul . i n

bifm opiunea butonul clic pe butonul Al doilea tabel

apoi dm un clic pe

. Se va reveni la fereastra iniial unde se va da un . n fereastra de rezultate vor aprea trei tabele.

Primul tabel prezint validitatea datelor.

199

ne d valoarea coeficientului alpha111, care n acest caz este 0,734. Se consider c fidelitatea itemilor este asigurat de la o valoare a coeficientului mai mare de 0,8, deci putem spune c n acest caz nu avem asigurat validitatea itemilor. Ultimul tabel

ne arat variaia coeficientului alpha dac eliminm un item. De exemplu, dac eliminm itemul 1 obinem un coeficient alpha de 0,646.

5.3. Concluzii
n aceast seciune am ncercat s prezentm doar o parte din posibilitile celor dou soft-uri de prelucrare statistic a datelor. Pentru

200

cei care doresc s vad mai multe din posibilitile acestor soft-uri recomandm de exemplu pentru Excel [Bott], [Pom] iar pentru SPSS recomandm [How].

201

Bibliografie

nr 1 2 3

litera Abr Alex Bar

Denumire Abric J.C. (2002) Psihologia comunicrii. Teorii i metode Editura Polirom, Iai Alexandrescu P. (2004) Introducere n statistica social Editura Paralela 45, Bucureti Brz S. (2004) Iniiere n internet i realizarea paginilor Web Editura Fundaiei Romnia de Mine, Bucureti Beaty J. (2004) Lumea n viziunea lui Peter Drucker Editura Teora, Bucureti Bott E. (2001) - Utilizare Microsoft Office 2000 Editura Teora, Bucureti Chelcea S, Mrginean I., Cauc I (1998) Cercetarea sociologic Editura Destin, Deva Chelcea S (1975) Chestionarul n investigaia sociologic Editura tiinific i Enciclopedic, Bucureti Colman A., Pulford B. (2006) - A Crash Course in SPSS for Windows Blackwellpublishing, Oxford Diestel R. (2005) Graph Theory Springer-Verlang, New York (electronic edition) Durkheim E. (2002) Regulile metodei sociologice Editura AntetXX Press,

4 5 6 7

Bea Bott Che1 Che2

8 9 10

Col Die Durk

202

11 12

Fish Fota1

Fisher R.A. (1925) - Statistical methods for research workers Oliver and Boyd, London Fotache M. (2001) SQL. Dialecte, DB2, Oracle i Visual FoxPro Editura Poliron, Iai Fotache M. (2005) Proiectarea bazelor de date Editura Polirom, Iai Gataulin A., Lica D., Pomohaci C.M. (2002) Biostatistica intuitiv Editura CERES, Bucureti Howitt D., Cramer D. (2006) Introducere n SPSS pentru psihologie Editura Polirom, Iai Isaic-Maniu A., Mitru C., Voineagu V. (2003) Statistic Editura Universitar, Bucureti Kinkoph S. (2004) Power Point 2003 n imagini Editura Teora, Bucureti Lica D., Pomohaci C.M. (1998) Biostatistica U.S.A.M.V.B., Bucureti J.K. Lindsey (2004) Introduction to applied statistics. A modeling approach Oxford University Press Inc., New York Mrginean I. (1982) Msurarea n sociologie Editura tiinific i Enciclopedic, Bucureti Matheson D.W., Bruce R.L. Beauchamp K.L. (1970) Introduction to experimental psychology Holt, Rinehart and Winston Inc., New York McCollum J.K., Bnacu C.S. (2005) Management de proiect o abordare practic Editura Universitar, Bucureti

13 14 15 16 17 18 19

Fota2 Gat How Isa Kin Lic Lin

20 21

Mar Mat

22

McC

203

23 24 25 26

More Nast Pear Pom

Moreno J.l. (1969) Les fondements de la sociometrie PUF, Paris Nstase P., Mihai F. (2001) - Baze de date - Microsoft Access 2000 Editura Teora, Bucureti Pearson K., Lee A (1902-1903) - Inheritance of physical characters Biometrica 2:357 Pomohaci C.M. (2005) Noiuni introductive de utilizare a computerului: Word, Excel, Documente HTML Editura Didactic i Pedagogic, Bucureti Radu I i colab. (1993) Metodologie psihologic i analiza datelor Editura Sincron, Cluj Rateau P. (2004) Metodele i statisticile experimentale n tiinele umane Editura Polirom, Iai Rotariu T, Bdescu G., Culic I, Mezei E., Murean C. Metode statistice aplicate n tiinele sociale Editura Polirom, Iai Ruane J.M. (2004) - Essentials of Research Methods Blackwellpublishing, Oxford Rummel R.J. (1983) - Libertarianism and International Violence - The Journal of Conflict Resolution 27 (March 1983): 27-71 Snedecor G.W. (1968) Metode statistice aplicate n cercetrile de agricultur i biologie Editura Didactic i Pedagogic, Bucureti Stahl H.H. (1974) Teoria i practica investigaiilor sociale Editura tiinific i Enciclopedic, Bucureti Stnil O. (1985) Noiuni i tehnici de matematic discret Editura tiinific i Enciclopedic,

27 28 29

Rad Rat Rot

30 31

Rua Rum

32

Sne

33 34

Sta Stan

204

Bucureti 35 Ste R.G.D. Steel, J.H.Torrie (1980) Principles and procedures of statistics. A biometrical approach McGraw-Hill International Editions Stoica V. (2000) Metodologia analizei politice Editura Fides, Iai Tagiuri R (1952) Relational analysis: an extension of sociometry method with emphasis upon social perception Sociometry, nr.15 arc M. (1998) Tratat de statistic aplicat Editura Didactic i Pedagogic, Bucureti ian E., Ghi S., Tranda C. (2001) Bazele statisticii Editura Meteor Press, Bucureti Velicanu M, Bodea C., Lungu I., Ioni C., Bdescu G.(1999) Sisteme de Gestiune a Bazelor de Date Editura Petrion, Bucureti

36 37

Sto Tag

38 39 40

ar i Vel

205

Note explicative :

206

1
2

Vezi la bibliografie [Rua]. Cf [Vel] 3 cf [McC] pag. 29 4 cf. [McC] 5 backward planning denumire preluat din lucrarea [McC] 6 Pentru studentul ce-i pregtete proiectul de diplom recomandm cea de-al doilea tip de proiectare, backward, ntruct exist constrngerea temporal. 7 Program Evaluation and Review Technique 8 Metoda Drumului Critic 9 cf [McC] pag. 199 10 [Rad] pag.21 11 [Rad] pag.22 12 [Rad] , pag 225 13 cf [Rad] 14 n [Rad] acest caz poart denumirea de moarte experimental, pag. 39 15 De instrumentele statistice ne vom ocupa n capitolul 3 16 Despre noiunea de eantion vezi capitolul 3, seciunea 3.3. 17 cel mult s-ar fi gndit ca alta dat s fie mai atent i s nu mai lase laboratorul cu ustensilele murdare 18 appud. [Cau], pag 103-104 19 cf [Cau] 20 appud [Che1] 21 sex, vrst, mediu, nivel de studii, etc. 22 Despre noiunea de eantion vezi capitolul 3, seciunea 3.3. 23 cf. [Che2] 24 vezi clasificarea chestionarelor dup forma ntrebrilor 25 cf [Che2] 26 n [Che2] 27 dei este ludabil dorina unor studeni de a explora i a gsi noi metode i teste pe care mai apoi s le valideze, le recomandm ca mai nti s nvee s foloseasc foarte bine testele deja validate i dup acumularea unei experiene semnificative s porneasc pe drumurile noi i neexplorate ale testrii psihologice 28 n lucrarea [Rad], pg. 358 29 n lucrarea relational analysis: an extension of sociometry method with emphasis upon social perception 30 cf [Abr] 31 cf [Abr] 32 cf [Rad] , pag 47 33 termen preluat din [Rad] 34 prin ordonare aici nelegem ordine nu i comparaie 35 prin stimul nelegem chiar i aplicarea unei ntrebri 36 despre noiuni generale privitor la mulimile fuzzy vezi anexa 1. 37 Pentru claritatea expunerii prezentm exemplul doar pe 10 elevi, n practic ns nu se recomand s se trag concluzii pe un grup att de mic. 38 Pentru traducere vezi finalul acestui capitolul. 39 Sau serie cronologic 40 Sau serii teritoriale 41 Datele prezentate sunt ipotetice 42 orizontal 43 aceste etichete pot fi sub forma de text sau numere 44 vertical 45 cunoscute sub denumirea de grafice 46 Sursa: U.S. Census Bureau, International Data Base. Pentru 2004 este dat desigur o estimare. 47 Putem observa chiar c ultmul exemplu se ncadreaz n aceast clas de reprezentri 48 Am pus doar opiunile ce au ntrunit mai mult de 2%. 49 n englez - Pie 50 Le-am sistematizat sub forma unui tabel. 51 vom pstra denumirea n englez deoarece n dicionar la cuvntul slide am gsit diapozitiv, lamel ceea ce mi s-a prut c ar reduce nelegerea posibilitilor acestui instrument. 52 Mi s-a prut mai aproape de ceea ce este afisat denumirea de slide alb decat cea de slide gol. 53 montat la un video proiector poate transmite pe un ecran imaginile de pe slide-uri

54 55

cf. Fisher R.A. (1925) - Statistical methods for research workers Oliver and Boyd, London de exemplu [Alex] 56 Am folosit termenul de proprietate pentru a cuprinde amndou posibilitile: Etichetei s-i fie asociat o valoare sau o calitate 57 O alt denumire pentru populaie este i colectivitate statistic 58 de costuri, de control al rezultatelor, etc. 59 cf [Rat] 60 reamintim c elementele pot fi persoane, obiecte, idei, opinii, evenimente, etc. 61 ntruct nu constituie scopul acestei lucrri nu voi insista asupra problemelor legate de eantionare. 62 cel dinaintea petrecerii fenomenului 63 cel de dup ce fenomenul studiat a avut loc. 64 s observm c obinerea de diferene semnificative ntre cele 2 loturi nu nseamn automat c un sistem de notare este mai bun dect cellalt. 65 populaie, eantion sau lot 66 n acest caz putem spune c este vorba de un lot deoarece nu ne intereseaz caracteristicile populaiei, ci fenomenul. 67 matematic vorbind este vorba de intersecia celor 2 evenimente 68 cf. [i] pag. 114 69 am luat n considerare doar anxietatea manifest 70 Aceast medie a populaieise poate gsi n scala de interpretare a testului. 71 Aa cum vom vedea mai departe acest mijloc se numete median 72 n [Rot] este numit individ median pag.46 73 Se pot folosi mai multe metode n momentul cnd avem de analizat punctaje rezultate n urma unor preri subiective. De exemplu la notele acordate la concursurile de patinaj se elimin cea mai mare i cea mai mic valoare i se realizeaz media valorilor rmase. 74 Esli b 75 Notai n continuare cu TSS. 76 Notai n continuare cu TSL. 77 Acest noiuni trebuie tratate cu atenie ntruct din punct de vedere al denumirii sunt foarte asemntoare. Reamintim faptul c prin cuantile nelegem acele puncte din serie ce mpart seria de numere n pri egale. 78 De exemplu n Excel avem funcia MEDIAN. 79 Adic Q1 80 Am preferat aceast denumire celorlalte denumiri cum ar fi modul sau moda, pentru a evita confuziile. 81 Reamintim c tendina era dat de poziia medianei fa de medie. 82 Val crit-val exp = 40 - 35 83 Abaterea medie fa de valoarea a 84 Sursa: Anuarul Statistic ediia martie 2003 85 n lucrarea Statistical methods for research workers cap VI 86 deoarece aflm rezultatele din consultarea mediilor din catalogul de note, deci interaciunea cu elevii este practic zero. 87 pe de alt parte un numr mai mare de msurtori efectuate nseamn i cheltuieli mai mari (att din punct de vedere financiar ct i ca timp) 88 Aa cum ns se observ din seciunea cu testele de comparare a mediilor diferenele ntre medii este nesemnificativ 89 Sursa: Anuarul Statistic ediia martie 2003 90 cf. [Stn], pg 91 n unele manuale se folosete denumirea de vrfuri 92 Sau muchii 93 Am luat n considerare doar anxietatea manifest 94 n exemplul prezentat intenionat am pus irul pe dou coloane, pentru a arta c nu este obligatoriu ca irul s fie pe o singur cooan 95 aici se observ c n selecia fcut pot fi i celule goale, acestea fiind ignorate de ctre funcia TTEST. 96 Sau 5% 97 rezultat obinut din n= 11 minus 2 98 De altfel la curs voi prezenta anumite noiuni de statistic necesare nelegerii SPSS-ului. Vezi de asemenea i bibliografia. 99 Editarea a datelor 100 de ieire 101 gen Excel 102 Type in data 103 dar nu este obligatoriu

104 105

de exemplu, dac avem date de tip ir de caractere atunci se va selecta opiunea Nominal. n englez chi-test 106 n coloana Name nu se accept spaii libere, de aceea am pus _ ntre cele dou cuvinte ce compun denumirea categoriei. 107 Ultima n list 108 Pearson Chi-Square 109 df 110 desigur n practic numrul poate fi mult mai mare, dar am optat doar pentru 8 subieci pentru claritatea expunerii 111 se mai numete i coeficientul lui Cronbach

You might also like