You are on page 1of 49

Cursul nr 1.

Introducere n statistic social


Ce este statistica social?
Sociologia= tiin care studiaz societatea omeneasc i legile ei. tiin care se
ocup cu studiul descrierii structurii i fiziologiei societii, al relaiilor interumane n
cadrul grupurilor sociale, precum i al instituiilor din societatea dat
tiinele sociale i propun n general s descrie realitatea social i s o explice,
realiznd predicii asupra posibilelor evoluii ulterioare ale fenomenelor, structurii
sociale etc.
Cum stabilim legiti (construim teorii)?
-experimente
-ancheta sociologic pe baz de chestionar (cvasiexperiment)
Pentru a prelucra datele din ancheta pe baz de chestionar este nevoie de metode statistice.
Statistica social ofer instrumente de investigaie i de analiz care servesc celor trei
mari obiective: descrierea, explicaia i predicia.
1.
Descrierea datelor: care este starea de sntate a populaiei din Romnia; care este
situaia n Romnia d.p.d.v. al divorialitii/natalitii?
2.
Explicarea datelor: care sunt factorii la nivel macro cu impact asupra strii de
sntate a populaieie din Romnia?(sistemul de sntate, nivelul de dezvoltare a societii);
care sunt factorii la nivel macro care determin creterea/scderea divorialitii/natalitii?
Exemple implicaii practice: construirea de teorii, realizarea unor msuri pentru a
interveni (politici publice)
3.
Realizarea de predicii asupra populaiei, generalizarea datelor la nivel de
populaie; (acest lucru se realizeaz doar atunci cnd se lucreaz cu anchet sociologic pe
baz de eantion i se dorete estimarea datelor la nivelul ntregii populaii de referine);
Exemple implicaii practice: identificarea exact a potenialilor alegtori, identificarea
exact a numrului de apartamente care ar trebui construite etc.
Prin urmare, statistica social este preocupat de culegerea datelor i de analiza i
interpretarea datelor. Trebuie ns subliniat faptul c statistica social reprezint un simplu
instrument care deservete aceste scopuri. Nu este o ramur a matematicii (nu avem axiome,
nu se fac demonstraii, de aceeea pentru scopuri similare vom avea mai multe tipuri de
indicatori)
n concluzie, Statistica social este o tiin care are drept obiect stabilirea regulilor de
culegere, prelucrarea i interpretare a datelor.
Cu alte cuvinte, cu ajutorul statisticii sociale, pe de o parte vom nva cum s
proiectm i s realizm o cercetare la standarde ct mai aproape de rigorile tiinifice, iar pe
de alt parte cum s analizm datele (s descriem, s gsim explicaii sau cum s facem
predicii la nivelul populaiei. Metodele statistice necesare analizei datelor, pot fi utilizate att
pe date rezultate n urma unor anchete sociologice pe baz de chestionar, analiz de coninut
cantitativ, fie pe date la nivel macro (indicatori baze de date oficiale). Chiar i atunci cnd nu
suntem n ipostaza de a realiza cercetri tiinifice, cunotinele dobndite n cadrul acestui
curs ne vor fi utile pentru a avea abilitatea de citi i nelege rezultatele cercetrilor ntreprinse
de alte persoane.
Exemple de programe pentru prelucrarea datelor n tiine sociale: SPSS, Excel, SAS,
AMOS, RData. Programul cel mai utilizat n Romnia este SPSS (Software Package for
Social Sciense). Nu e nevoie s avem cunotine avansate pentru a nelege acest program.
1

Concepte de baz n statistica social


Orice persoan care rspunde la chestionar
Subiect, repondent, individ
Toate persoanele din care a fost extras eantionul
Populaie
Orice ntrebare din chestionar.
Item
Seria de numere reprezentat de rspunsurile o ntrebare din
Variabil
chestionar.
-un set de metode pentru descrierea datelor: tabele, grafice
statistic descriptiv
exprimate n procente sau frecvene (numr de cazuri), indicatori
statistici precum media, mediana, modul, indicatori de dispersie etc
statistic
deductiv
sau Forme:
1.estimarea parametrilor populaiei pornind de la observaiile fcute
inferenial
pe un eantion, dac sunt ndeplinite condiiile de reprezentativitate
care s permit o astfel de operaie;
Ex1: estimm procentul celor care voteaz la nivelul unui jude,
estimm procentul vrstnicilor care sunt implicai n voluntariat
Atunci cnd extragem un eantion lucrm cu diferite erori i trebuie
s fie reprezentativ; ce nseamn reprezentativ?
Exemplu de eantion nereprezentativ i sondajele politice
2. testarea unor ipoteze
Ex2:identificm o serie de factori cu impact asupra strii de sntate
a populaiei, deci atunci cnd testm o serie de ipoteze tiinifice
Ex3: realizm comparaii ntre datele obinute pe diferite populaii
-dorim s vedem dac exist diferene privind mulumirea fa de
sntate ntre persoanele din diferite judee sau medii de reziden
-dac exist diferene dintre romii din Garcini i romii din alte
comuniti
-dac exist diferen ntre persoanele cu boli mentale care sunt
instituionalizai i care nu sunt

Cursul nr 2. Etapele unui proiect de cercetare


Care sunt paii unei cercetri pn ajungem la analiza datelor cu ajutorul metodelor
statistice? (ancheta pe baz de chestionar)
EXEMPLU
1. Definirea temei de cercetare: voluntariatul n rndul persoanelor vrstnice
2. Definire obiectivelor de cercetare
2.1. Identificarea atitudinii persoanelor vrstnice fa de voluntariat
2.1.1. Identificarea gradului de implicare a vrtsnicilor n voluntariat
2.1.2. Identificarea factorilor care diminueaz implicarea vrstnicilor fa de
voluntariat
2.1.3. Identificarea atitudinii persooanelor fa de comportamentele de
ntrajutorare
3. Documentarea
3.1.De unde m informez?
3.1.1 De la specialiti
Din cri de specialitate
Articole din reviste de specialitate (ilustrare)
Studii /rapoarte de cercetare realizate de alte persoane (surse credibile)
Ce urmresc?
Cum au studiat alii aceast tematic
Indicii pentru alegerea metodei de cercetare
Indicii pentru dimensiuni/indicatori din instrument (chestionar)
Teorii utilizate care explic termenul nostru cheie (comportamentul de ntrajutorare)
Limite/obstacole/probleme ntmpinate
Exemplu: bazele de date internaionale-de pe portal
Exemplu-Rapoarte Fundaia Soros
3.1.2 De la publicul int (ex.persoanele vrstnice-cercetare exploratorie)
3.1.3.. De la clientul nostru
3.1.3 De la alte publicuri co-interesai de tematic (ex.instituiile publice/private de
asisten social din Braov)
4. Tipul de cercetare
4.1 descriptiv
4.2 explicativ
4.3. predictiv
Nu sunt disjuncte
5. Ipoteze doar pt 4.2
Ex1: Realizm o cercetare legat de starea de sntate a populaiei.Din alte studii
reiese faptul c emoiile pozitive sau reeaua social sunt factori, Nu tim dac e adevrat i pe
publicul nostru int (persoane vrstnice). Testm aceste bnuieli (ipoteze tiinific)
6*. Definirea termenilor (definiie terminologic sau operaionalizarea conceptelor)
7. Definim universul cercetrii i stabilim caracteristicilor eantionului
cercetare exhaustiv/cercetri selective
De ce sunt selective?
1. fie populaia este prea mare i nu o putem acoperi

2. fie sunt cercetri pe o tem delicat unde nu poi aplica chestionare dect pe eantion de
voluntari
Exemple cercetri exhaustive: angajaii unei companii/instituii
Exemple cercetri selective: profesorii din licee, cercetri pe persoane cu dizabiliti,
cercetri pe persoane dependente de droguri/bolnavi de cancer
Exemplu-Rapoarte Fundaia Soros
8*.Realizarea instrumentului de cercetare (chestionar)
Exemplu-Rapoarte Fundaia Soros
9.Culegerea datelor
10.Prelucrarea datelor
Se introduce datele n SPSS (este doar unul din programele de prelucrare)
Se analizeaz datele cu ajutorul metodelor statistice
11. Redactarea raportului de cerceare
Se descrie tema, se stabilete dac ipotezele se confirm sau nu i soluiile practice
pentru problemele studiate (acolo unde este cercetare aplicativ)
Exemplu-Rapoarte Fundaia Soros

CURS 3. Msurarea n sociologie (tiinele socio-umane)


Pentru a putea realiza punctul 6* i 8* din schema etapelor unei cercetri, trebuie s
nelegem ce nseamn a msura. Punctele 6, 8, 9 i 10 sunt etape ce fac parte din procesul
de msurare a variabilelor. Etapele 7, 9, 10, 11 in de obiectul statisticii sociale
1. Ce reprezint msurarea n sociologie (tiine socio-umane)?
A msura nseamn a descrie i este legat deci de cercetrile descriptive
Exist dou tipuri de msurare
a. Msurare din ochi
b. Msurare instrumental (tiinific)
a. Msurarea din ochi

n primul rnd a msura este a DENUMI un obiect/o stare/un comportament/un


eveniment, dac nu denumim nu putem msura, dac denumim prost msurm prost
..ex. asta e pisic, sta e cine
..vrem s vedem care este situaia persoanelor vrstnice din punct de
vedere al singurtii..Cum denumim acest lucru? Starea civil?
Statusul marital al persoanei? Reea social)
Vrem s vedem care este situaia persoanelor vrstnice d.p.d.v. al
educaiei..Cum denumim? Nivel de educaie? Nivel de studii?(anii de
coal finalizai)
Vrem s vedem ct de bine triesc persoanele vrstnice..Cum
denumesc asta? Bunstarea? Venituri? Bogie?
denumim variaiile de principiu a ceea ce am denumit..ex cinele sta e mai mare, sta
mediu, sta mai mic, sau e mai puterninc, asa si asa, deloc etc
care sunt ipostazele posibile pentru ceea ce am denumit?
4

Atribuim cifre variaiilor de principiu/ipostazelor


o Aceste cifre se atribuie dup nite reguli-din Teoria nivelelor de msurare
o Aceast lucru se face de regul atunci cnd transpunem variabilele n
instrumentul de cercetare (n cazul nostru, chestionarul; doar despre acest
instrument discutm n anul I, deoarece n special pentru datele culese cu acest
instrument vorbim de analiz cu ajutorul metodelor statistice.
Creem contextele i modalitile prin care putem numra cte obiecte/evenimente se
afl n fiecare variant/ipostaz
Numrm efectiv ct obiecte/evenimente avem n fiecare ipostaz

Cnd vorbim despre msurare din ochi?


Vorbim despre msurare din ochi atunci cnd suntem n una din situaiile urmtoare:
a1.Propria noastr minte ne spune ceva despre denumirea i variaia de principiu a
unei variabile
a2.Clientul cercetrii noastre ne spune ceva despre o variabil
a3.Subiecii cercetrii noastre ne spun ceva despre o variabil
a4.Persoanele care formeaz publicurile interesate de cercetarea noastr ne spun ceva
despre o variabil
Msurri simple
implicarea n activiti de voluntariat (formal)
motivele neimplicrii n activiti de voluntariat (bani, timp, sntate, nu tiu unde etc)
satisfacia fa de activitile de voluntariat ntreprinse
timpul alocat activitilor de voluntariat
Exemple chestionar_viata_de_familie
Exemplu vrsta msurat ordinal/interval/raport
Msurri complexe (avem nevoie de un numr mai mare de indicatori)-operaionlizarea
conceptului
satisfacia fa de FSC o putem msura simplu-ordina/interval

satisfacia fa de FSC (-o putem msura complex-se dau note dar nu se tie ce a
evaluat fiecare student/student, ecerciiu cu studenii..la ce s-a gndit fiecare cnd a
evaluat, putem stabili variaiile de principiu i atribui numere sau mergem i mai fin la
indicatori)
o Aspecte materiale (spaii, tehnologie etc)
o Procesul de nvmnt (planuri de invmnt, discipline opionale/facultative,
coninutul disciplinelor, practic, activiti tiinifice, oportuniti de afirmare
profesional-burse, erasmus,manifestari tiinifice, sprijin financiar etc)
o Profesori (prezena la curs/seminar, stilul de predare, pregtirea profesional
etc)
o Colegi (stilul de relaionare, de nvare)

atitudinea fa de voluntariat
o Componenta cognitiv?
o Componenta afectiv?
o Componenta comportamental?
5

Stabilii denumirea, variaiile de principiu i atribuii numere


Exemple chestionar viata_de_familie
b. Msurarea instrumental
Ii dm o denumire terminologic, identificm un termen dintr-o teorie (punctul 6 din
etape)
Ex..tim la nivelul simului comun c bogia nu se suprapune neaprat
peste gradul de cultur a unei persoane..cum denumesc combinaia
asta?...status social? ..clas social?....
Determinm variantele n care variabila respectiv se poate manifesta (variaia de
principiu) (punctul 6 din etape)
Atribuim cifre variaiilor de principiu/ipostazelor
Aceste cifre se atribuie dup nite reguli-din Teoria nivelelor de msurare
Aceast lucru se face de regul atunci cnd transpunem variabilele n
instrumentul de cercetare (n cazul nostru, chestionarul; doar despre acest
instrument discutm n anul I, deoarece n special pentru datele culese cu acest
instrument vorbim de analiz cu ajutorul metodelor statistice.
Creem contextele i modalitile prin care putem numra cte obiecte/evenimente se
afl n fiecare variant/ipostaz
Numrm efectiv ct obiecte/evenimente avem n fiecare ipostaz
c. Msurarea din ochi versus msurarea tiinific (instrumental)
Msurarea din ochi nu este un substitute al msurrii instrumentale, ci doar o etap
premergtoare msurrii instrumentale
o Pe baza iformaiilor obinute reuim s dm un nume variabilei respective
Ex. Sunt situaii (cele mai multe) cnd nu este o operaie uoar
denumirea i avem nevoie de aceast etap premergtoare..performane
colare, comportamente de ntrajutorare, voluntariat formal/informal
Identificm variaiile de principiu, setul de ipostaze
Atribuim cifre ipostazelor conform unor reguli de atribuire
Atenie! n anul I facem doar msurare din ochi

CURS 4. Definirea universului cercetrii i stabilirea caracteristicilor


eantionului
1. Definirea universului cercetrii i stabilirea caracteristicilor eantionului (punctul 7
din schema privind etapele de cercetare)
1.1. Universul cercetrii
Ex.persoanele vrstnice din municipiul Braov/judeul Braov/zonele urbane din
judeul Braov
1.2. Caracteristicile eantionului
1.2.1. Cercetarea exhaustiv
Pornind de la obiectivul menionat n schema privind etapele de cercetare ce tip de
cercetare este potrivit (atitudinea persoanelor vrstnice fa de voluntariat)?
1.2.2. Cercetare selectiv
Principiul de baz ale eantionrii
Presupoziia care st la baza eantionrii este c analiza unui eantion din populaia
cadru conduce la rezultate similare cu acelea obinute prin investigarea ntregii populaii, cu
condiia respectrii unor condiii statistice i teoretice de asigurare a reprezentativitii.
Cum definim reprezentativitatea unui eantion?
Reprezentativitatea este o noiune relativ. Nu se poate vorbi de
reprezentativitate/nereprezentativitate, ci de mai mult/mai puin reprezentativ.
Reprezentativitatea nu poate fi stabilit n general ci doar prin raportare la o serie de
variabile. Aceste variabile ar putea fi: sex, vrst, educaie, ocupaie, naionalitate etc. Cu ct
lum n calcul mai multe variabile cu att eantionul are un grad mai ridicat de
reprezentativitate.
Un eantion are o reprezentativitate n raport cu vrsta, alt reprezentativitate n raport
cu sexul .a.m.d. Se poate afirma c un eantion este reprezentativ n raport cu variabila sex,
dac el respect structura pe sex a populaiei cadru1.
Folosirea expresiei de eantion reprezentativ este corect doar dac el este
reprezentativ pe toate caracteristicile studiate.
Ex. Dorim s proiectm un eantion pentru studiul mai sus menionat (persoanele vrstnice
din municipiul Braov). Acest eantion va trebui s respecte structura populaiei vrstnice din
municipiul Braov dup sex (cel puin).
Tabelul 4.1: Structura eantionului n funcie de structura populaiei n funcie de sex
Structura populaiei cadru n Structura
teoretic
a
funcie de variabila sex
eantionului n funcie de
variabila sex
Masculin
40%
Identic cu cea la nivelul
populaiei
Feminin
60%
Total
100%

1 Datele referitoare la populaia cadru (universul cercetrii) pot fi iobinute de la INSSE (tempo on-line) sau de
la Direciile Judeene de Statistic
7

Condiii pentru respectarea reprezentativitii


Asigurarea reprezentativitii eantionului presupune respectarea urmtoarelor trei
condiii n ceea ce privete selecia subiecilor:
1. Includerea n eantion a subiecilor fr a acorda vreo preferin unora dintre ei,
fiecare fiind selectat dup criterii aleatoare, dup principiul hazardului combinaional,
avnd o probabilitate cunoscut i diferit de zero (echireprezentarea).
2. Eantionul trebuie s fie suficient de mare (de ordinul sutelor) pentru a permite
redarea caracteristicilor principale ale populaiei originare i, pe aceast baz,
obinerea unor indicatori cu un grad mare de fidelitate.
3. Unitile incluse n eantion trebuie s fie independente una de alta.
Pentru a realiza cercetri selective se utilizeaz instrumente specifice. Apar ntr-un
asemenea context mai multe probleme:
estimarea erorii produse prin colectarea unei valori pe eantion n loc s o
calculm pe ntreaga populaie; E
evaluarea ncrederii pe care putem s o acordm valorilor pe eantion ca
reprezentnd valori similare pentru populaia ntreag (prin aplicarea testelor
de semnificaie). P
Reprezentativitatea unui eantion este cuplul [E, P]. Nu putem ameliora simultan i
precizia estimrii i sigurana acesteia.
Ce informaii trebuie s precizez la aceast etap din cadrul proiectului?
a.Volumul eantionului (cte persoane voi intervieva?)
p= procentul din populaia cadru care posed o caracteristic
q = 100-p

P=99%
P=95%
P=90%

t=2,58
t=1,96
t=1,68

t 2 xpxq
n
E2

Tabelul 4.2: Relaia dintre n, E i P


p=procentul persoanelor Eroarea
de Volumul
vrstnice care au o eantionare
eantionului
atitudine
favorabil
voluntariatului formal

Ex.1 p=10%, q=90%


Ex2. p=10%, q=90%
Ex3. p=q=50%,

n=384 persoane
n=864 persoane
n=1067
persoane
Ex4. p=q=50%,
E=2%,
n=2401
persoane
p=procentul persoanelor Eroarea
de Volumul
vrstnice care au o eantionare
eantionului
atitudine
favorabil
voluntariatului formal

Ex.1p=10%, q=90%
Ex2. p=10%, q=90%
Ex3. p=q=50%,
Ex4. p=q=50%,

E=3%
E=2%,
E=3%,

E=3%
E=2%,
E=3%,
E=2%,

n=665persoane
n=1498persoane
n=1849persoane
n=4160persoane

P=probabilitatea
de garantare a
rezultatelor
(datelor
ce
rezult n urma
analizelor)

P=95%

P=probabilitatea
de garantare a
rezultatelor
(datelor
ce
rezult n urma
analizelor)

P=99%

Cum decidem volumul eantionului?


Din punct de vedere formal, pentru determinarea mrimii eantionului se face un
arbitraj ntre diveri factori.
Factori de ordin statistic
P, probabilitatea de garantare a rezultatelor
E, eroare de eantionare
R, reprezentativitatea eantionului
o Cu toate c o cretere a eantionului va mri precizia rezultatelor, ea nu va
elimina i nici nu va reduce influena distorsiunii din procedura de selecie. De
aceea, msurarea eantionului n sine nu este suficient pentru a asigura
succesul cercetrii.
o Reprezentativitatea atinge destul de repede un nivel suficient de ridicat, aa
nct o cretere suplimentar a numrului de indivizi n eantion nu mai aduce
un spor notabil de reprezentativitate

Figura 4.1:Relaia dintre reprezentativitatea eantionului i volumul eantionului


Factori de ordin administrativ (de organizare a culegerii datelor)
Modalitatea de analiz a datelor (subeantioane reprezentative) ex. Analiza atitudinii
p.v. pe gen
Non-rspunsurile (profilul celor care fac voluntariat)
Se vor lua n calcul resurse de bani, timp, oameni
b.Metoda de eantionare (cum vor fi alei subiecii la nivel teoretic) i caracteristicile
eantionului
b.1. Eantionarea teoretic de principiu
Se descrie metoda de eantionare i se specific caracteristicile eantionului astfel
nct s fie reprezentativ dup cel puin o variabilExist dou categorii de metode de eantionare
1. metode de eantionare aleatorii (probabiliste)
2. metode de eantionare nealeatorii (neprobabiliste)
Comparaii
1. metode de eantionare aleatorii 2. metode de eantionare nealeatorii
(probabiliste)
(neprobabiliste)
Se pot face inferene statistice la
Datele caracterizeaz doar eantionul
nivelul populaiei din care a fost
de persoane intervievate
extras
Se pot generaliza datele. Concluziile
Nu se pot generaliza datele.
sunt legiti pentru populaia din care
Concluziile sunt posibile tendine
a fost extras

b.2. Eantionarea practic (efectiv)


Eantionul scos din teren nu se pliaz exact pe cel proiectat. Trebuie testat
reprezentativitatea lui n funcie de variabilele luate n calcul pentru proiectarea eantionului.
Uneori este nevoie de ponderri ale eantionului.

10

CURS 5. Metode de eantionare probabiliste


5. Metode de eantionare probabiliste
5.1.Eantionarea aleatorie
5.2.Eantioanarea sistematica
5.3.Eantionarea stratificat
5.4.Eantionarea multistadial
5.5.Eantionarea multifazic
5.6.Eantioanarea cluster
5.7.Eantioane fixe panel
5.1. Eantionarea aleatorie
Informaii de care avem nevoie pentru a aplica acest tip de eantionare
O list cu populaia de referin (cadru)
Procedee:
Procedeul bilei revenite
Procedeul bilei nerevenite
5.2.Eantioanarea sistematic
Informaii de care avem nevoie pentru a aplica acest tip de eantionare
O list cu populaia de referin (cadru)
Se stabilete un pas mecanic K
5.3.Eantionarea stratificat
Procedee:
a) Eantionarea stratificat proportional
b) Eantionarea stratificat neproporional
c) Eantionarea stratificat optim
a.Eantionarea stratificat proportional
Etape:
1. se stabilete populaia de referin
2. se stabilesc straturile populaiei (care de regul sunt grupri naturale, ex licee, facultai,
judee etc)
3. se stabilete volumul eantionului pe fiecare strat n parte n funcie de proporia volumului
populaiei din acel strat raportat la volumul ntregii populaii de referin
4.unitile (persoanele, clasele, grupele, gospodriile) care vor fi intervievate vor fi selectate
aleator (adic au aceeai ans de a fi extrase n eantion/o ans similar- vezi 5.1 sau 5.2)
Exemplu. Dorim s realizm o cercetare pe tema fertilitii la nivelul judeului Braov.
Scopul este de a ntreprinde politici demografice de cretere a natalitii. Presupunem n
(volumul eantionului)=2000 persoane2
1. se stabilete populaia de referin (populaia cu vrsta ntre 15-49 de sex feminin din
judeul Braov, Tab 3, coloana 3)
2. se stabilesc straturile populaiei (I categorie de straturi-vrsta (Tab 3, coloana 1), a II-a
categorie de straturi-mediul de reziden (Tab 3, coloana 3, 4))
3. se stabilete volumul eantionului pe fiecare strat n parte n funcie de proporia volumului
populaiei din acel strat raportat la volumul ntregii populaii de referin, pentru fiecare
categorie de strat n parte (Tab 3, coloana 5, Tab 4 coloana 5, 6)
4.unitile (persoanele, clasele, grupele, gospodriile) care vor fi intervievate vor fi selectate
aleator (adic au aceeai ans de a fi extrase n eantion/sau anse aproximativ egale- vezi
5.1 sau 5.2)
2 aceasta cifr a fost rotunjit pentru uurina n calcule
11

Pentru acest punct este nevoie de o list cu cu populaia de referin (persoane de sex feminin
din mediul urban cu vrsta 15-44 ani i cu persoanele de sex feminin din mediul rural cu
vrsta 15-44 ani)
Tabelul 5.1: Eantionarea stratificat proporional-dup volumul populaiei de sex
feminin din judeul Braov-prima categorie de straturi (categoriile de vrst)
Eantionare stratificat proproional
ni (repartizarea
pi
(repartizarea
volumului
volumului
eantionului pe
Ni (volumul populaiei de populaiei pe fiecare strat n
Straturile
sex feminin pe prima
prima
parte-din
(categorii de
Rate fertilitate
categorie de straturicategorie de
prima
vrst-femei)
20123
vrsta)4
straturi)
categorie)
1
2
3
4
5
13341
9,9%
199
15-19 ani
35
17292
12,9%
258
20-24 ani
64
25430
19%
379
25-29 ani
83
26707
19,9%
398
30-34 ani
59
27777
20,7%
414
35-39 ani
25
23619
17,6%
352
40-44 ani
4
45-49 ani
0,2
TOTAL
134166
100%
2000
Tabelul 5.2: Eantionarea stratificat proporional-dup volumul populaiei din judeul
Braov-a doua categorie de straturi (mediul de reziden)
Eantionare stratificat proporional

I categorie
de straturivrsta
1
15-19 ani
20-24 ani
25-29 ani
30-34 ani
35-39 ani
40-44 ani
TOTAL

ni
(repartizare
a
volumului
eantionulu
i pe fiecare
strat n
parte-prima
categorie
de straturi)
2
199
258
379
398
414
352
2000

pj (repartizarea volumului
populaiei de sex feminin pe a
doua categorie de straturimediul de reziden)5
urban
rural
3
4
63,8%
36,2%
68,7%
31,3%
74,3%
25,7%
77,1%
22,9%
76,4%
23,6%
73,7%
26,3%
73,7%
26,3%-

ni (repartizarea volumului eantionului pe


fiecare strat n parte-din a doua categorie)
urban
rural
5
6
127
72
177
81
282
97
307
91
316
98
260
92
1469
531

3 Datele sunt reale, preluate de pe http://statistici.insse.ro/(Tempo-Online)


4 idem
5 ibidem
12

b.Eantionarea stratificat neproporional


-nu ine cont de structura populaiei n funce de volum ci de alte criterii mai relevante pentru
cercetare
Etape:
1. se stabilete populaia de referin
2. se stabilesc straturile populaiei (care de regul sunt grupri naturale, ex licee, facultai,
judee etc)
3. se stabilete volumul eantionului pe fiecare strat n parte n funcie de importana variabilei
luate n calcul din acel strat raportat la total
4.unitile (persoanele, clasele, grupele, gospodriile) care vor fi intervievate vor fi selectate
aleator (adic au aceeai ans de a fi extrase n eantion/o ans similar- vezi 5.1 sau 5.2)
Exemplu. Pentru cercetarea mai sus menionat despre fertilitatea n judeul Braov, mai util
pentru cercetare este eantionarea stratificat neproporional. Este mai util s inem cont de
mrimea ratei de fertilitate pe fiecare categorie de vrst. Presupunem n (volumul
eantionului)=2000 persoane6
1. se stabilete populaia de referin (populaia cu vrsta ntre 15-49 de sex feminin din
judeul Braov, Tab 5, coloana 1)
2. se stabilesc straturile populaiei (I categorie de straturi-vrsta (Tab 5, coloana 1), a II-a
categorie de straturi-mediul de reziden (Tab 5, coloana 1))
3. se stabilete volumul eantionului pe fiecare strat n parte n funcie de importana variabilei
luate n calcul (ratele de fertilitate,Tab 5, coloana 3,4, Tab 6 coloana 5,6)
4.unitile (persoanele, clasele, grupele, gospodriile) care vor fi intervievate vor fi selectate
aleator (adic au aceeai ans de a fi extrase n eantion/sau anse aproximativ egale- vezi
5.1 sau 5.2)
Pentru acest punct este nevoie de o list cu cu populaia de referin (persoane de sex feminin
din mediul urban cu vrsta 15-44 ani i cu persoanele de sex feminin din mediul rural cu
vrsta 15-44 ani)
Tabelul 5.3: Eantionare stratificat neproporional-judeul Brasov-prima categorie de
straturi
esantionare stratificata neproproional
ni(volumul eantionului
Categorii de
Rate fertilitate
pi (ponderea ratei de fertilitate n funcie de pi,
vrst
2012
coloana 3)
n suma ratelor de fertilitate)
1
2
3
4
0,130
15-19 ani
35
259
0,237
20-24 ani
64
474
0,307
25-29 ani
83
615
0,219
30-34 ani
59
437
0,093
35-39 ani
25
185
0,015
40-44 ani
4
30
45-49 ani
0,2
TOTAL
270
1
2000

6 Aceasta cifr a fost rotunjit pentru uurina n calcule


13

Tabelul 5.4: Eantionare stratificat neproporional-judeul Brasov-a doua categorie


de straturi
esantionare stratificata neproproional
ni(volumul
eantionului n
funcie de
ratele de
ni(volumul
fertilitate pe
pj (repartizarea ponderei ratelor de fertilitate eantionului n
Categorii de
categorii de
pe a doua categorie de straturi-mediul de funcie de pi, coloana
vrst
vrst)
3,4)
reziden)7
rural
rural
urban8
urban
2
4
6
1
3
5
259
0,258
0,742
67
192
15-19 ani
474
0,307
0,693
146
328
20-24 ani
615
0,437
0,563
269
346
25-29 ani
437
0,508
0,492
222
215
30-34 ani
185
0,556
0,444
103
82
35-39 ani
30
0,466
0,534
14
16
40-44 ani
2000
TOTAL
2000
Cum difer volumul eantionului n funcie de cele dou tipuri de eantionare?
1. La eantionarea stratificat proporional ar trebui s se intervieveze un numr mare de
femei cu vrsta peste 35 de ani i n numr mult mai mare din urban
2. la eantionarea stratificat neproporional ar trebui s se intervieveze mai puine femei cu
vrsta peste 35 de ani i mai multe cu vrsta 20-35 ani, DAR mai multe din mediul rural
(pentru c acolo este rata de fertilitate mai mare)
Dac dorim s vedem care sunt motivele pentru care cele care dau natere la copii fac
acest lucru, atunci acest tip de eantionare (al doilea) este mai potrivit. Dac dorim s
vdem de ce femeile din urban nu doresc s dea natere la copii, probabil primul tip
de eantionare este mai potrivit (pentru ca ine cont de ponderea populaiei din urban)
Prin urmare ce metod de eantionare folosim? Cea care corespunde cel mai bine
obiectivului cercetrii noastre, dar i costurilor de timp i bani.

c.Eantionarea stratificat optim


-ine cont att de volumul populaiei de referin pe fiecare strat n parte dar i de variaia unei
variabile pe fiecare strat n parte
Etape:
1. se stabilete populaia de referin
2. se stabilesc straturile populaiei (care de regul sunt grupri naturale, ex licee, facultai,
judee etc)
3. se stabilete volumul eantionului pe fiecare strat n parte n funcie de importana variabilei
luate n calcul din acel strat raportat la total
4.unitile (persoanele, clasele, grupele, gospodriile) care vor fi intervievate vor fi selectate
aleator (adic au aceeai ans de a fi extrase n eantion/o ans similar- vezi 5.1 sau 5.2)
7 ibidem
8 ratele de fertilitate au fost luat separat urban/rural pe fiecare categorie de vrst a populaiei de sex feminin. Datele sunt reale, preluate de pe
http://statistici.insse.ro/(Tempo-Online)

14

Exemplu. Dorim s realizm o cercetare privind bunstarea populaiei Romniei. Vom utiliza
aceast metod de eantionare deoarece ine cont att de volumul populaiei pe fiecare strat n
parte dar i de gradul de eterogenitate n ce privete veniturile (Tab 7, coloana 4). Se tie
faptul c cu ct o populaie este mai eterogen d.p.d.v.d a unei variabile de interes pentru
cercetare cu att volumul eantionului ar trebui s fie mai mare, pentru a surprinde diferitele
categorii de persoane.
Tabelul 5.5: Eantionarea stratificat optim-macroregiuni Romnia

Straturi
1
Macroregi
unea unu
Macroregi
unea doi

Ni
(volumul
populaiei
pe fiecare
macroregi
une)9
2

esantionare stratificat optim


pi%
(ponde
rea
volum
ului
popula
iei pe
Deviatia
fiecare standard a
Ni* i
strat n veniturilor
(deviatia
parte)
i 10
standard)
3

pi% din
Ni*i

ni=n* Ni*i
/suma Ni*i

4950475

25%

705 3490084875

43%

880

5792920

29%

405 2346132600

29%

591

Macroregi
unea trei

5379697

27%

300 1613909100

20%

407

Macroregi
unea patru

3862722

19%

125

482840250

6%

122

19985814

100%

7932966825

100%

Total

5.4.Eantionarea multistadial
-nu e de sine stttoare
-se combin cu stratificat
-diferite tipuri de uniti de eantionare sunt analizate n diferite etape
Ex. Eantionarea bistadial stratificat, unde n primul stadiu au fost selectate facultile care
particip la studiu, iar n al doilea stadiu au fost selectate programele de studiu.
5.5.Eantionarea multifazic
-acelai tip de uniti de eantionare sunt analizate n etape diferite cu instrumente diferite
5.6.Eantioanarea cluster
-presupune existena unor grupri naturale (regiuni istorice, macroregiuni, judee ect)
1. gruprile naturale sunt diferite ntre ele i trebuie s lum n eantion din toate gruprile
naturale

9 Datele sunt reale, preluate de pe http://statistici.insse.ro/(Tempo-Online)


10 Date fictive
15

2. se consider c unitile de eantionare din cadrul gruprilor naturale sunt omogene d.p.d.v
al unei variabile importante pentru studiu, astfel nct nu conteaz prea mult modul de
selectare a unitilor
5.7.Eantioane fixe panel
-cercetarea se realizeaz pe aceleai persoane la un interval de timp

Curs 6. Metode de eantionare neprobabiliste


6.1. Eantionare la ntmplare
6.2. Eantioane de voluntari
6.3. Eantionarea dirijat
6.4. Eantionare pe cote
a. cote simple
Etape:
1. se stabilete populaia de referin
2. se stabilesc cotele populaiei (care de regul sunt raportate la variabila sex i vrst, dar
poate fi orice alt variabil socio-demografic; poate fi o singur cot sau mai multe)
3. se stabilete volumul eantionului pe fiecare cot n parte n funcie de ponderea volumului
populaiei pe fiecare cot n parte
4.unitile (persoanele, clasele, grupele, gospodriile) care vor fi intervievate vor fi selectate
ntmpltor, dar pentru a se asigura condiii apropiate de reprezentativitatea unui eantion sunt
stabilite nite criterii obiective (aceasta este diferena major fa de eantionarea
stratificat)
Not. Dac sunt respectate condiii stricte pentru selectarea indivizilor aceasta metod de
eantionare se apropie cel mai mult de metodele de eantionare probabiliste.
Exemplu. Tema cercetrii: Atitudinea fa de persoanele cu disabiliti. Populaia de
referin: persoanele din municipiul Braov cu vrsta 15-64 ani (date reale). Volumul
eantionului n=2000 persoane
Tabelul 6.1: Eantionarea pe cote simple n funcie de sex-municipiul Braov
Sex
Ni11 (volumul pi (ponderea ni
populaiei
populaiei pe (repartizarea
municipiului
cele dou c volumului
Braov)
cote)
eantionului
pe
fiecare
cot
n
parte)
1
2
3
4
Masculin
103155
48%
960
Feminin
111023
52%
1040
Total
214178
100%
2000

11 Datele sunt reale, preluate de pe http://statistici.insse.ro/(Tempo-Online)


16

Tabelul 6.2: Eantionarea pe cote simple n funcie de vrst-municipiul Braov


Ni12 (volumul pi (ponderea ni
populaiei
populaiei pe (repartizarea
municipiului
cele dou c volumului
Braov)
cote)
eantionului
pe
fiecare
Vrsta
cot n parte)
2
3
4
1
9158
4,3%
86
15-19 ani
37641
17,6%
351
20-29 ani
54916
25,6%
513
30-39 ani
43773
20,4%
409
40-49 ani
46292
21,6%
432
50-59 ani
22398
10,5%
209
60-64 ani
214178
100%
2000
TOTAL
b. cote combinate
Tabelul 6.3: Eantionarea pe cote combinate n funcie de sex i vrst-date la nivelul
populaiei din municipiul Braov
Gen
Vrsta
masculin
feminin
Total
15-19 ani
4616
4542
9158
20-29 ani
18795
18846
37641
30-39 ani
27415
27501
54916
40-49 ani
20900
22873
43773
50-59 ani
20667
25625
46292
60-64 ani
10762
11636
22398
Total
103155
111023
214178
Tabelul 6.4: Eantionarea pe cote combinate n funcie de sex i vrst-date la nivelul
eantionului pentru populaia din municipiul Braov
Date
realemunicipiul
Braov
Vrsta
masculin
15-19 ani
4,5%
20-29 ani
18,2%
30-39 ani
26,6%
40-49 ani
20,3%
50-59 ani
20%
60-64 ani
10,4%
TOTAL
100%

Gen

Ni
*volumul
eantionului)

feminin
4,1%
17%
24,8%
20,6%
23,1%
10,5%
100%

masculin
43
175
255
195
192
100
960

feminin
43
177
258
214
240
109
1040

TOTAL
86
351
513
409
432
209
2000

Care este diferena dintre eantionarea stratificat proproional i cea pe cote?

12 idem
17

esantionare stratificata
versus eantionare pe
cote

eantionare stratificat
proporional

eantionare
pe cote

PRIMUL
STRAT

AL DOILEA STRAT (face


parte din primul strat)

cote
combinate

cote simple

categorii
vrst

gen

gen

vrst

unitatea de eantionare nu
este selectat aleator

unitatea de
eantionarea este
selectat aleator

Figura 6.1: Diferene dintre metoda de eantionare stratificat i cea pe


cote
Cum stabilim ce metode de eantionare folosim?
1. Dac avem timp i bani i avem acces la date referitoare la populaia de referin (list cu
toate unitile de eantionare) atunci vom apela la metodele de eantionare probabiliste
(aleatorie/sistematic/stratificat)
2. Dac avem timp i bani i avem acces la date referitoare la populaia de referin (doar date
generale legate de structura pe sex, vrst etc) atunci vom apela la metodele de eantionare
neprobabiliste (pe cote)
3. Dac nu sunt suficiente resurse de timp i bani dar avem ceva date referitoare la populaia
de referin putem apela la eantionarea cluster.
4. Dac nu putem avea acces la populaia de referin (tema cercetrii este delicate) sau nu
sunt resurse de bani, vom apela la eantionarea neprobabilista (dirijat, la ntmplare, de
voluntari)
Exerciii
1. Dorim s realizm o cercetare pe tema divorialitii
a. Ce metod de eantionare ai folosit?
b. De ce ai ales aceast metod de eantionare ?
c. De ce informaii avei nevoie pentru a putea realiza aceast metod de
eantionare? Avei acces la aceste informaii?
2. Dorim s realizm o cercetare privind relaiile de cuplu, doar pe cuplurile care
triesc n uniune consensual?
a. Ce metod de eantionare ai folosit?
b. De ce ai ales aceast metod de eantionare ?
c. De ce informaii avei nevoie pentru a putea realiza aceast metod de
eantionare? Avei acces la aceste informaii?

18

CURS 7.METODE DE ESANTIONARE NEPROBABILISTE-EXERCIII


Esantionare pe cote
a. simple
Tema cercetrii: Atitudinea fa de persoanele cu disabiliti
Populaia de referin: persoanele din municipiul Braov (date reale)
n=2000 persoane
Sex Persoane Ni
volumul Pi-procente
ni
15-64 ani
populaiei
Masculin
103155
48%
960
Feminin
111023
52%
1040
Total
214178
100%
2000

Vrsta
15-19 ani
20-29 ani
30-39 ani
40-49 ani
50-59 ani
60-64 ani
TOTAL
b. combinate
Date reale-municipiul
Braov
Vrsta
15-19 ani
20-29 ani
30-39 ani
40-49 ani
50-59 ani
60-64 ani
TOTAL

Ni volumul
populaiei
9158
37641
54916
43773
46292
22398
214178

Pi-procente
4,3%
17,6%
25,6%
20,4%
21,6%
10,5%
100%

ni
86
351
513
409
432
209
2000

Gen
masculin
4616
18795
27415
20900
20667
10762
103155

Date privind numrul


de chestionare ce
trebuie realizate
Vrsta
masculin
15-19 ani
20-29 ani
30-39 ani
40-49 ani
50-59 ani
60-64 ani
TOTAL
960

feminin
4542
18846
27501
22873
25625
11636
111023

TOTAL
9158
37641
54916
43773
46292
22398
214178

Gen

feminin

TOTAL
86
351
513
409
432
209

1040

19

2000

Date
realemunicipiul
Braov
Vrsta
masculin
4,5%
15-19 ani
18,2%
20-29 ani
26,6%
30-39 ani
20,3%
40-49 ani
20%
50-59 ani
10,4%
60-64 ani
TOTAL
100%

Gen

ni *volumul eantionului)

feminin
4,1%

masculin
43

feminin
43

TOTAL
86

17%

175

177

351

24,8%

255

258

513

20,6%

195

214

409

23,1%

192

240

432

10,5%

100

109

209

100%

960

1040

2000

Care este diferena dintre eantionarea proproional i cea pe cote simple?


esantionare
stratificata versus
eantionare pe
cote

eantionare
stratificat
proporional

eantionare pe
cote

PRIMUL STRAT

AL DOILEA STRAT
(face parte din
primul strat)

cote simple

gen

cote combinate

categorii vrst

gen

vrst

Figura 7.1. Diferene dintre eantionarea proporional i cea pe cote

Exercitii
3. Dorim sa realizam o cercetare pe tema divortialitatii
a. Ce metoda de esantionare ati folosi?
b. De ce ati ales aceasta metoda ?
c. De ce informatii aveti nevoie pentru a putea realiza aceasta esantionare? Avem acces
la aceste informatii?
4. Dorim sa realizam o cercetare privind relatiile de cuplu, doar pe cuplurile care traiesc in
uniune consensuala?
a. Ce metoda de esantionare ati folosi?
b. De ce ati ales aceasta metoda ?
c. De ce informatii aveti nevoie pentru a putea realiza aceasta esantionare? Avem acces
la aceste informatii?
20

Curs 8. Culegerea datelor


1. Aspectice practice ale eantionrii
Dup ce am proiectat teoretic un eantion, cum facem n mod practic pe teren s
selectm persoanele care urmeaz s fie intervievate?
Atunci cnd aplicm o metod de eantionare care necesit o list cu populaia cadru,
lucruri sunt simple. Vor fi intervievate acele persoane care au fost selectate din list.
Cum se procedeaz ns atunci cnd nu exist o list cu populaia cadru?
Pasul 1. Alegerea zonelor/localitilor/cartierelor
Metoda areolar/pe zone
Se va lua zona vizat pentru cercetare i va fi mprit n zone care vor deveni
obiecte de selecie aleatorie simpl sau stratificat. n cazul zonelor alese se poate proceda la
un nou stadiu de selecie sau dac unitile sunt mici pot fi intervievate toate persoanele
incluse aici.
Ex1. Municipiul Braov (se va lua harta i se va mpri oraul pe cartiere/puncte de
votare)
Ex2. Judeul Braov (se va lua harta i se va mpri judeul pe zone (urban/rural)/
localiti/cartiere/strzi
Pasul 2. Alegerea punctelor de sondaj (gospodriilor)
Metoda itinerarelor (random route)
Ex. Se pot trage la sor un numr de strzi/a unei adrese de pe fiecare strad. O dat
aleas prima adres, operatorul de interviu va primi instruciuni de selectarea a urmtoarelor
adrese de pe strad
Pasul 3. Alegerea persoanei de intervievat
Este indicat de a lsa ct mai puin la latitudinea opratorului modul de selectare a persoanelor.
Se pot da fie doar cote i atunci el are o marj destul de mare de a selecta indivizii, fie se pot
da scheme complexe se selectare a persaonelor. (vezi Rotariu Traian i Ilu Petru, Ancheta
sociologic i sondajul de opinie, Ed Polirom, Iai, 2006, 185-187)
Ex.primul care i-a srbtorit cel mai recent ziua de natere, scheme mai complexe

2.Managementul cercetrii
Plan de aciune-Diagrama Gantt
Prentmpinarea i diminuarea diferitelor tipuri de erori

21

Exemplu. Planificarea activitilor pentru o cercetare cantitativ (anchet pe baz de chestionar)


ACTIVITATEA

LUNA
I
sptmna
1

2
sptmna

1. ntlnire cu beneficiarii prestaiei sociologice


(pentru clarificarea obiectivelor cercetrii i
aspectelor financiare)
2. Documentarea
3. Stabilirea metodologiei de lucru (metoda, tehnica,
procedeul, volumul eantionului/metoda de
eantionare)
3. Realizarea instrumentului/instrumentelor
cercetrii
4. Selectarea operatorilor de teren
5. Pretestarea instrumentului/instrumentelor
cercetrii
6. Culegerea datelor din teren
7. Realizarea bazei de date/bazelor de date
8. Realizarea raportului de cercetare
9. Prezentarea raportului de cercetare

22

3
sptmna
4

4
sptmna
4

3. Tipuri de erori (ce se refer la managementul eantionrii)


a. Erori ntmpltoare (ex. Operatorul a notat greit vrsta)
Eroarea final (la nivel de grup) se numete eroare net. Dac numrul persoanelor
intervievate este mare atunci aceast eroare net tinde ctre zero.
b. Erori sistematice
o La nivelul respondentului
o La nivelul operatorului
o La nivelul celui care realizeaz instrumentul cercetrii (chestionarul)
b.1. Erori intenionate
Modaliti de a preveni erorile intenionate
La nivelul respondentului
La nivelul operatorului
La nivelul celui care
realizeaz instrumentul
cercetrii (chestionarul)

ntrebri de control
Instruire, experien
Verificarea muncii de teren
Controlul i sancionarea firmei
de cercetare de ctre clientul
cercetrii

b.2. Erori neintenionate


b.2.1.Erori legate de construirea chestionarului
Erori datorate formulrii ntrebrilor
o Limbajul
o Coninutul
Ex1. Dou ntrebri n aceeaiai propoziie (n ce msur suntei mulumit
de coninutul procesului de nvmnt i de dotrile tehnice din
Facultatea de Sociologie i Comunicare?)
Ex2.rspunsuri dezirabile (Suntei de acord ca statul s intervin n
protejarea mediului nconjurtor? control Ct la sut din venitul dvs ai fi
dispus se mearga la taxe pentru mediu?)(nr7)
Erori generate de numrul i ordinea ntrebrilor
o Numrul ntrebrilor (durata interviului este prea mare, un numr mare de
ntrebri msurate pe aceeai scal)
o Ordinea
ntrebri dificile
Contaminarea rspunsurilor
Erori generate de forma de rspuns
o Se sugereaz variante de rspuns cnd de fapt el nu are o opinie
o ntrebrile deschise (Ce prere avei despre construirea Aeroportului din
Ghimbav? sau Sunteti de acord cu construirea Aeroportului din Ghimbav?)
o Ordinea variantelor de rspuns (efectul cap de list)
Erori produse de construcia grafic a chestionarului (greu de completat)
b.2.2.Erori datorate operatorilor de interviu
Trsturi de personalitate (calitatea reelei de operatori)
Corelaia dintre tema cercetrii i atitudinea respondentului fa de tema
Anticipaiile operatorului
o Anticipaiile de structur-atitudine
o Anticipaii de rol
o Anticipaii de probabilitate
23

b.2.3.Erori datorate respondenilor


Dezirabilitatea social
Limitele memoriei umane
Procesarea i interpretarea informaiei (nu neleg, nu sunt ateni etc)

Curs 9_10. Analiza datelor


Etape premergtoare analizei datelor. Cu alte cuvinte ce avem de fcut dup am adunat
datele din teren?
9.1. Realizarea unei baze de date
-selectarea chestionarelor valide
-numerotarea chestionarelor
-realizarea unui cap de tabel (care s conin i numrul chestionarelor)
-completarea bazei de date

9.2. Verificarea i corectarea bazelor de date


-Frecvene simple-Find_Replace (vezi laborator)

9.3. Verificarea reprezentativitii eantionului (dac am utilizat metode de eantionare


probabiliste sau neprobabiliste pe cote)
Avem urmtoarele situaii? Putem considera c este respectat structura populaiei n funcie de sex,
vrst sau naionalitate dac am lucrat cu o eroare de +/-2%?
Tabelul nr.9.1: Structura populaie i a eantionului n funcie de sex
Structura populaiei municipiului
Structura eantionului dupa sex
Braov dup sex
masculin
47.2%
44%
feminin
52.8%
56%
Total
100%
100%
Tabelul nr.9.2: Structura populaie i a eantionului n funcie de vrst
Structura populaiei municipiului Braov
Structura eantionului dup vrst
dup vrsta
18-24 ani
14.1%
14.4%
25-29 ani
11.2%
12.2%
30-34 ani
9.4%
11.6%
35-39 ani
9.0%
8.7%
40-44 ani
7.6%
7.3%
45-49 ani
8.9%
7.5%
50-54 ani
11.2%
10.9%
55-59 ani
8.6%
7.4%
peste 60 ani
19.9%
20%
Total
100%
100%
Tabelul nr.9.3: Structura populaie i a eantionului n funcie de naionalitate
Structura populaiei municipiului Braov
Structura eantionului dup naionalitate
dup naionalitate
roman
90.7%
92.5%
maghiari
8.1%
6.9%
rromi
0.3%
0%
germani
0.6%
0.3%
alta
0.3%
0.3%
Total
100%
100%

24

9.4. Ce facem dac eantionul nu respect structura populaiei?


-ponderarea eantionului
Tabelul nr.9.2: Ponderarea eantionului n funcie de sex
Structura populaiei municipiului
Structura eantionului dupa Variabila de ponderare
Braov dup sex
sex
masculin
47.2%
44%
1.07 (47,2%/44%)
feminin
52.8%
56%
0,94 (52,8%/56%)
Total
100%
100%
-toate analizele in SPPSS se fac n funcie de variabila ponderat (aceast variabil se introduce la
DATA/ WEIGHT CASES)

9.5. analiz univariat a datelor


9.6. analiz bivariat
9.7. analiz multivariat
9.8 raportul de cercetare

9.5.Analiza univariat a datelor-descrierea datelor


Fiecare variabil este analizat separat.
a. Tabele de frecvene i grafice cu o singur variabil (pentru varibile msurate pe scal nominal
sau ordinal)
Tabele de frecvene

25

Grafice
De unde se fac i tabelele de frecvene

SAU DIN

b. Indicatori de poziie (media, mediana, modul)(pentru variaile msurate pe scal de


interval sau raport)
Redau printr-o singur valoare numeric nivelul general al seriei.
b1. Media-Se adun scorurile i se mpart la numrul total de scoruri sau la numrul total de
frecvene relative (formula 2)-valoarea medie
Notaie:

26

Not: Media, modul se poat utiliza i pentru variabile ordinale

Media: Formula 1

Medie aritmetic simpl


n

x
i 1

Dac utilizm frecvene formula devine:

Media: Formula 2medie


Medie ponderata
ponderata
s

k
i 1

xi
unde s = numrul de categorii/clase; ki = frecvena

Cele dou formule prezentate sunt echivalente.


n practic, ns, unii utilizatori comit eroarea de a considera c formula 2 este o medie
ponderat. ns, media ponderat apare atunci cnd se ncalc principiul democraiei statistice care
spune n esen c fiecare individ statistic conteaz ct oricare alt individ. Eroarea apare atunci cnd
frecvenele sunt considerate ponderi.
Trebuie s reinem nc un aspect deosebit de important: media nu este o valoare mijlocie;
media poate fi foarte departe de mijlocul intervalului de valori.
Exemplu 1.Media-(formula 1). Care este nivelul mediu de pregtire al studenilor din grupa
1 de la programul de studiu Sociologie la disciplina Statistic social univariat?
Presupunem c avem 10 studeni n grup care au urmtoarele note la Statitic social
univariat:xi :4,8,5,7,6,9,5,4,10,9
=6,7
Interpretare: Studenii din grupa 1 au n medie nota 6,7. Deci, gradul lor de cunotine este
unul de nivel mediu la aceast disciplin.
Exemplu 2.Media-(formula 2). Aceeai serie de date formula 1
Aceleai note ale studenilor le punem n tabele cu frecvene xi:4,8,5,7,6,9,5,4,10,9
Nota-xi
Frecevena ki
4
2
5
2
6
1
7
1
8
1
9
2
10
1
n=10-numrul de note (numrul de ki)
=6,7
Interpretare: idem exemplu 1

27

Exemplu 3.Media-(formula 2). Presupunem c avem un student care a luat urmtoarele note
la cele 7 discipline dintr-un semestru. Fiecare disciplin are un numr de credite. Care este media
studentului pe semestru?
Nota-xi
Creditele ki
4
5
5
3
6
4
7
5
8
5
9
4
10
4
Total
n=30
n=30-numrul de credite (numrul de ki)
=7
Interpretare: Studentul are media 7 pe primul semestru.
b2. Modul-valoarea cea mai des ntlnit
Notaie:Mo
Exemplu 4.Modul. Ct de des merg (cte zile pe luna) studenii la bibliotec din grupa 1de la
programul de studii Sociologie. Presupunem c avem n=10 studeni n grup care au mers astfel la
bibliotec...
Nr zile xi:1, 0, 5, 7, 5, 4, 5, 2,3, 4,
Mo=5
Interpretare: Cei mai muli studeni au mers 5 zile pe sptmn.
Exemplu 5.Modul. Lum acelai exemplu cu notele studentilor din grupa 1 la Statistica
sociala: xi: 4,8,5,7,6,9,5,4,10,9
Mo=4, 5, 9
Interpretare: n acest caz nu avem o singur valoare modal, i atunci vom spune c cei mai
muli studeni au luat nota 4, 5 sau 9.
b3. Mediana-valoarea care mparte seria n dou pri egale
Notaie: Me
Exemplu 6.Mediana. Notele studentilor din grupa 1 la Statistica sociala
Presupunem c avem 10 studeni n grup xi: 4,8,5,7,6,9,5,4,10,9
Seria ordonat.xi: 4,4, 5, 5, 6, 7, 8, 9, 9, 10
Me=(6+7)/2=6,5 (suma celor dou valori de la mijloc)
Interpretare: 50% dintre studeni au luat note pn n 6,5 iar 50% peste 6,5.
Exemplu 7.Mediana. Ct de des merg (cte zile pe luna) studenii la bibliotec din grupa 1
xi: 1, 0, 5, 7, 5, 4, 5, 2,3,
Seria ordonat: xi 0, 1, 2, 3, 4, 5, 5, 5, 7
Me=4 (valoarea de la mijloc)
Interpretare: 50% dintre studeni au mers la bibliotec pn n 4 zile pe lun, iar 50% peste 4
zile pe lun

28

Exemplu 8.Modul.
Presupunem c avem 80 de studeni de la programul de Asisten social care au luat
urmtorele note la disciplina Statistic social univariat.
Nota-xi nota studenilor din anul I
Frecevena ki
AS
4
10
5
25
6
8
7
15
8
10
9
7
10
5
Total
80
Mo= 5
= 6,38
Me=6.03
Formula 3. Relaia dintre cei trei indicatori. Mo = Me 3 ( x -Me)

Cum decidem cnd folosim unul din indicatori?


Dac seria este omogen, putem utiliza media, dac seria este eterogen folosim mediana sau
modulul.
Cum vedem dac o serie este omogen sau nu?
Abaterea standard, coeficientul de variaie.
c. Indicatori de dispersie
Indicatorii de dispersie reflect gradul de inegalitate ntre indivizi (omogenitate/eterogenitate).
Indicatorii de dispersie reprezint msura n care indivizii se disperseaz pe scala de valori; msoar
inegalitile dintre indivizi (ex. veniturile indicatorul de dispersie relev imediat inegalitile
existente)
c1.Amplitudinea distana dintre cea mai mare valoare i cea mai mic, arat ct de mare e variaia
scorurilor
Notaie: A
Formula 4. Amplitudinea. A = xmax xmin
Exemplu 9. Amplitudinea
Presupunem c avem 80 de studeni de la programul de Asisten social care au luat
urmtorele note la disciplina Statistic social univariat.
Nota-xi nota studenilor din anul I
Frecevena ki
AS
4
10
5
25
6
8
7
15
8
10
9
7
10
5
Total
80
A=10-4=6
29

C2. Abaterea standard (deviaia standard) -Msoar gradul de eterogenitate sau de dispersie fa
de medie. Cu ct are o valoare mai mare cu att seria este mai eterogen.
Notaie: (sigma)
Exemplu 10.Abaterea standard-serie simpl
Presupunem c avem o serie cu banii pe care i-au cheltuit un grup de studeni ntr-o sptmn,
pe produse de birotic (euro). n grup sunt 20 de studeni. Dorim s aflm ct de mprtiate sunt
valorile fa de medie. Cu alte cuvinte, studentii pot fi considerai un grup omogen sau eterogen ?
Formula 5. Abaterea standard-serie simpl
n

( xi x ) 2

i 1

Formula 6. Abaterea standard serie cu frecvene


n

k (x
i 1

x)2

Exemplu 10. Abaterea standard-(formula 5)


Xi : 2, 4, 6, 8, 10, 12, 14, 20, 22, 24, 25, 25, 26, 29, 30, 33, 38, 45, 50, 60
Formula 5. =22,9 =15,69
Cum interpretm? E mare sau mic aceast dispersie? n lipsa unui standard e greu pentru un
nceptor s estimeze dac grupul este omogen sau nu.
Exemplu 11. Abaterea standard-(formula 6)
Nota-xi nota studenilor din anul I
Frecevena ki
AS
4
10
5
25
6
8
7
15
8
10
9
7
10
5
Total
80
Formula 6. =1.77, =6.38
Cum interpretm? E mare sau mic aceast dispersie? n lipsa unui standard e greu pentru un
nceptor s estimeze dac grupul este omogen sau nu.
Cum interpretm prin raportare la celalalt exemplu? Nu putem.
Este mai uor noiunea de deviaie standard dac este vizualizat. Figura de mai sus conine
dou seturi de curbe de frecvena. Care dintre curbele din figura au deviaie standard mai mare? Dintre
curba A i B, distribuia valorilor din curba A este mai eterogen, are o deviaie standard mai mare de
la medie. Dintre curba C i D, distribuia valorilor din curba C este mai eterogen i are o deviaie
standard mai mare.

30

Figura nr.8.1. Curbe de distribuie ale valorilor


C3.Coeficientul de variaie-Este un indicator care indic gradul de omogenitate/eterogenitate a unei
A

D
C

serii de date. Se exprim n procente. Dac este mai mic dect 35-40%, atunci seria este omogen iar
media sa este reprezentativ,
Notaie: v
Formula 7. Coeficientul de variaie v

*100%

Exemplu 12. Coeficientul de variaie


=6.38
v=1.77/6.38= 0.2774= 27.74%
Interpretare: Coeficientul este mai mic de 40% deci seria este omogen i media este reprezentativ
Exerciiu. Avem o medie a cheltuielilor firmelor cu serviciile de comunicaii electronice de 2056 ron
i o abatere standard de 1158. Este media cheltuielor reprezentativ pentru toate firmele din Braov?
Variana 2
Denumit i dispersie, se definete ca fiind ptratul mediu al abaterilor valorilor observate de la
media lor. Variana este un index matematic al gradului n care scorurile deviaz de la medie (sau
sunt n varian cu ea). O varian mic indic faptul c majoritatea scorurilor distribuiei se aeaz
destul de aproape de medie; dac este mare, atunci scorurile sunt mprtiate mult. Deci, variana
este direct proporional cu gradul de dispersie. Pentru a calcula variana unei distribuii, media
este sczut din fiecare scor. Diferena se ridic la ptrat, apoi se mparte suma ptratelor la n
Formula 8. Variana-serie simpl
n

2=

i 1

( xi x ) 2
n

Exemplu 13. Variana (formula 8)


Lum acelai exemplu de mai sus cu preurile produselor achiziionate de un grup de studeni,
de data aceasta la un grup mai mare de 20 persoane.
Xi : 2, 4, 6, 8, 10, 12, 14, 20, 22, 24, 25, 25, 26, 29, 30, 33, 38, 45, 50, 60
n=20

x =22.9
2 = ((2-22.9)2 + (4-22.9)2 + (6-22.9)2 +......+ (60-22.9)2 )/20 = 246.34

31

Interpretare: Aceast valoare e greu de interpretat n lipsa unui referenial. Este folosit mai
degrab pentru calculul altor indicatori.
Formula 9. Variana-serie cu frecvene
n

2=

k (x
i 1

x)2

Exemplu 14. Variana (formula 9)


Nota-xi nota studentilor
din anul I AS
4
5
6
7
8
9
10
Total

Frecevena ki
10
25
8
15
10
7
5
80

x =6.38

= (( 10*(4-6.38)2 + 25*(5-6.38)2 +9*(6-6.38)2 +...+5*(10-6.38)2)/80=1.77


2

d.Mrimi multiple
d.1.Cuartilele
Sunt trei cuartile ce mpart seria de date n patru pri egale.
Cuartila inferioar este prima cuartil n ordine ascendent de aranjare a datelor. Se noteaz
cu Q1 i ne arat pn la ce valoare sunt distribuite primele 25% din valori.

Cuartila mijlocie, reprezint jumtatea seriei i este identic cu mediana, cuartila putnd fi
calculat n acelai mod ca i aceasta. Se noteaz cu Q2 (Q2=Me) i ne arat pn la ce
valoare sunt distribuite primele 50% din valori.

Cuartila superioar reprezint trei sferturi n ordine ascendent a datelor. Se noteaz cu Q3 i


ne arat pn la ce valoare sunt distribuite primele 75% din valori.

Ultima cuartil, Q4, reprezint ultima valoare din serie. Deoarece seria este ordonat
cresctor, aceast cuartil reprezint valoarea maxim din seria de date.

Pentru calcularea cuartilelor trebuie parcuri doi pai :


1. se calculeaz mai nti poziia n seria de date a respectivei cuartile ;
2. se calculeaz valoarea efectiv a cuartilei.
Exemplu 15. Cuartilele-serie simpl.
Notele studentilor din grupa 1 la Statistic social
Presupunem c avem n=10 studeni n grup xi: 4,8,5,7,6,9,5,4,10,9
Seria ordonat xi: 4,4, 5, 5, 6, 7, 8, 9, 9, 10
Q1 - cuartila inferioar
32

1.Poziia va fi egal cu: (n+1)/4=(10+1)/4= 2.753


Aceasta cuartil va fi al treilea numr al seriei. Aceasta nseamn c 5 este cuartila inferioar.
Q1==5
Interpretare: 25% dintre studeni au luat note pn la valoarea de 3 restul au luat peste 3.
Q3 - cuartila superioar
Poziia cuartilei superioare se obine n mod asemntor, cu excepia faptului c este vorba de
trei sferturi, deci vom multiplica poziia cuartilei inferioare cu 3. Poziia cuartilei superioare va fi egal
cu: 3(n +1)/4 = 8.258
Reprezint al optulea numr din secven. Aceasta nseamn c Q3=9
Interpretare: 75% dintre studeni au luat note pn la valoarea de 9 restul au luat peste 9.
Q2=Me- mediana
Poziia medianei va fi egal cu: 2(n +1 )/4 = 5.5(ntre 6 i 7)
Me= 6,5
Interpretare: 50% dintre studeni au luat note pn la valoarea de 6.5 restul au luat peste 6.5.
Prin cunoaterea cuartilelor obinem o imagine mai clar despre cum se distribuie datele seriei.
Exemplu 15. Cuartilele-serie cu frecvene.
Notele studenilor de la programul de studiu Asisten social la disciplina Statitic Social, sunt
redate mai jos....
Frecevena ki
Nota-xi nota studentilor
din anul I AS
4
10
5
25
6
8
7
15
8
10
9
7
10
5
Total
80
Tabelul de mai sus este transformat n acest tabel
Frecevena ki
Nota-xi nota studentilor
din anul I AS
4-5
35
6-7
23
8-10
22
Total
80
Poziia Q1= (80+1)/4=20, 2520
Este a 20 valoare din serie, se afla n primul interval a 20-a valoare
Q1=4+(1:35)*15=4,57
Interpretare??
Poziia lui Q3= 3* (80+1)/4=60,75 61
Este a 61 valoarea, se afla n al treilea interval a 3-a valoare
Q3=8+ (1:22)*3=8,13
Interpretare??

d.2.Decilele
Sunt 9 decile care mpart seria de date n 10 pri egale.
33

D1, este prima decil n ordine ascendent de aranjare a datelor. Ne arat pn la ce valoare
sunt distribuite primele 10% din valori.
D2, este a doua decil n ordine ascendent de aranjare a datelor. Ne arat pn la ce valoare
sunt distribuite primele 20% din valori.

D5, reprezint jumtatea seriei i este identic cu mediana, i cu Q2 i ne arat pn la ce


valoare sunt distribuite primele 50% din valori.
Ultima decil, D9,, reprezint ultima valoare din serie. Deoarece seria este ordonat cresctor,
aceast decil reprezint valoarea maxim din seria de date.

Exemplu 16. Decile- serie de date simpl


Lum acelai exemplu menionat mai sus cu preurile produselor achiziionate de un grup de
studeni, de data aceasta un grup mai mare de 20 persoane.
xi: 2, 4, 6, 8, 10, 12, 14, 20, 22, 24, 25, 25, 26, 29, 30, 33, 38, 45, 50, 60
Poziia decilelor se calculeaz ca i poziia cuartilelor excepie fcnd mprirea la 4. De data
aceasta pentru a calcula poziia decilelor, se va face mprirea la 10
Poziia decilei a asea D6, va fi egal cu 6 (n+1) : 10 =12, 6 13
D6=26 ron
Interpretare: 60% dintre studeni au achiziionat produse pn n 26ron, deoarece valoarea a
treisprezecea din serie este 26 ron.
Exemplu 17.Decile-serie de date cu frecvene.
Nota-xi nota studentilor
Frecevena ki
din anul I AS
4-5
35
6-7
23
8-10
22
Total
80
Dorim s calculm decila a patra, D4.
Poziia va fi egal cu: 4 (80 +1) : 10 = 32,4. Itemul 32 va reprezenta decila a patra. Aceasta
va fi cuprins n intervalul 4-5 ani . Prin urmare valoarea decilei a a patra va fi D4 = 4+ (1 : 35) 32=
4.91.
Interpretare: 40% dintre persoane au note pn n 4.9 ani, restul peste 4.9 ani.
d.3.Centilele
Sunt 99 centile care mpart seria de date n 100 pri egale.
C1, este prima centil n ordine ascendent de aranjare a datelor. Ne arat pn la ce valoare
sunt distribuite primele 1% din valori.
C20, este a douzecea decil n ordine ascendent de aranjare a datelor. Ne arat pn la ce
valoare sunt distribuite primele 20% din valori. C20=D2

C50, reprezint jumtatea seriei i este identic cu mediana, i cu D5 sau Q2 i ne arat pn
la ce valoare sunt distribuite primele 50% din valori.
Ultima decil, C99,, reprezint ultima valoare din serie. Deoarece seria este ordonat
cresctor, aceast decil reprezint valoarea maxim din seria de date.

34

Centilele
Sunt 100 de centile ce mpart irul de date n 100 de pri egale. Poziia oricrei centile se
obine n mod asemntor cu aflarea poziiei cuartilelor sau a decilelor. De exemplu, poziia celei de-a
treizeci i cincea centile este : 35 (n +1) : 100 unde n este numrul de itemi (valori).
Exemplu 18. Centile- serie cu frecevene
vrsta
frecvena ki
ntre 15 25 ani
30
ntre 25 35 ani
76
ntre 35 45 ani
38
ntre 45 55 ani
10
ntre 55 65 ani
5
TOTAL (n)
159
. Poziia oricrei centile se obine n mod asemntor cu aflarea poziiei cuartilelor sau a
decilelor. De exemplu, poziia celei de-a treizeci i cincea centile este : 35 (n +1) : 100 unde n este
numrul de itemi (valori).
Pentru exemplul anterior axndu-ne pe vrsta angajailor, de exemplu, poziia n serie a celei
de-a optzecea centile este : 80 (159 +1) : 100 = 128. Aceasta va fi n intervalul 35-45 de ani i este a
douzeci i doua vrst din interval, dup totalul de 106 angajai distribuii n primele dou intervale.
Aceasta nseamn c a optzecea centil a vrstei este:
P80= 35 + (10 : 38) 22= 40,8 ani
Interpretare: 80% dintre persoane au vrsta pn n 40,8 ani restul peste 40,8 ani..
Toi aceti indicatori se fac din SPSS de la meniul....

35

36

e. Distribuia normal a scorurilor unei serii ordonate cresctor


e1. Ce reprezint distribuia normal?
Distribuia normal este un model teoretic, unde scorurile nu se abat mai mult de 3 (deviaii

standard de la medie. Mai mult de att media, mediana i modul se afl toate la mijlocul
curbei. Cele dou jumtai sunt perfect simetrice.

n cazul distribuiilor asimetrice

e2. Cum putem afla dac variabila are sau nu o distribuie normal?
e2.1 Metode grafice
Histograma
Boxplot

Histograma
Se face n SPSS din meniul

37

38

Boxplot
Se face n SPSS n

Aceast variabil are sau nu distribuia normal?


Dac nu putem aprecia facem i alt metod grafic, cum ar fi BOXPLOT

39

Mustata-valoarea maxim pe care au dat-o subiecii

mediana

Mustata-valoarea minim pe care au dat-o subiecii

Linia boldat este mediana i ar trebuie s fie la jumtatea cutiei ca varibila s aib distribuie
normal.
Interpretare: n cazul de fa, linia nu este la mijlocul cutiei, deci variabila nu are distribuie normal.
Ne putem verifica i cu indicatorii formei distribuiei
40

e2.2Indicatori ai formei distribuiei


Oblicitatea (Skewnees)
Ne arat nclinarea
dac este > 0 cocoaa este deplasat spre stnga; dac este <0 spre dreapta.
Formula 10. Skewnees

(x
o

x)3

n 3

Boltirea (Kurtosis)
Ne arat ct este de ascuit sau plat cocoaa
Formula 11. Kurtosis

(x
b

x)4

n 4

-3

pentru curba normal b = 0


b > 0 cocoa nalt; lectocurtic;
b < 0 platicurtic.
Cu ct aceti indicatori au valori mai deprtate de valoarea zero cu att distribuia variabilei se
abate mai mult la stnga sau la dreapta sau este mai plat sau mai ascuit. Cu ct valorile acestor
indicatori sunt mai apropiate de valoare zeroa cu att distribuia variabilei este mai aproaee de
distribuia normal, fiind simetric fa de medie(media=medina=modul)
In SPSSS se fac din meniul...EXPLORE..fr sa bifm nimic se face automat tabelul de mai
jos...

Cum intepretm valorile cindicatorilor formei distribuiei?


Curba este mai ascuit dect cea normal. Ce nseamn acest lucru?
Curva este deplasat uor spre stnga. Ce nseamn acest lucru?

41

e2.3. Teste-Kolmogorov Smirnov


Graficele ne ajut s ilustrm distribuia valorilor, dar uneori nu putem aprecia fosrte bine dac acele
variabile au sau nu distribuie normal. De aceea este nevoie de teste, care ne vor spune cu siguran,
dac putem considera c o variabil are sau nu distribuie normal
Termeni utilizai n testarea ipotezelor
P=95%probabilitatea de garantare a rezultatelor (probbilitatea de a a avea dreptatea atunci
cnd respingem/acceptm ipoteza de nul)
=5% probabilitatea de a grei atunci cnd acceptm sau respingem ipoteza de nul
Ipotezele testului. Acestea difer de la test la test
o
o

H0=ipoteza de nul
H1=ipoteza alternativ

Modaliti de validare a ipotezei de nul sau alternative


o
o

fiecare test are o modalitate proprie


exist o modalitate general valabil la toate testele
Se compara pcalculat (cel din SPPS-de la rubric Sig) cu valoarea lui p (teoretic)
Lucrm de obicei cu P=95% atunci p va fi 0.05. Deci pcalculat se va compara cu 0.05.
Dac este mai mic se respinge H0. Dac e mai mare de 0,05 se va accepta H0.

Cum se face n SPSS Testul Kolmogorov Smirnov?


Tot din meniul EXPLORE..

Orice test are o ipotez de nul(H0) i una alternativ (H1)


H0: distribuia variabilei d2 nu difer de distribuia normal (teoretic)
H1: distribuia variabilei d2 difer de distribuia normal (teoretic)

42

Cum vedem care ipotez o acceptm?


Ne uitm la pcalculat(Sig.). dac e mai mic de 0.05 se respinge H0, dac e mai mare se accept H0. n
cazul de fa este 0.000 este mai mic de 0.05, deci se respinge H0. Cu alte cuvinte, variabila d2 nu are o
distribuie normal.

Curs 11_Analiza bivariat a datelor


11.1 Analiza variabilelor msurate pe scal nominal/ordinal
11.1.1 Grafice cu dou variabile
11.1.2 Tabele cu dou variabile (cu procente pe linie/coloan/total)
11.1.3 Teste de asociere Testul 2
Valoarea testului 2 se calculeaz n modul urmtor:
Formula 1. Testul 2

( Fobservate Fasteptate) 2
Fasteptate

Frecvenele ateptate sunt calculate n ipoteza independenei ntre variabile, folosind


formula (I) discutat anterior (pentru prima csu aceasta devine P11=P+1*P1+ sau F11= F+1*F1+/nr.
total de subieci). Se pornete, deci, de la distribuia marginal i se calculeaz valorile ateptate pentru
fiecare csu n parte, dup formula de mai sus.
Ipoteza de nul a acestui test presupune inexistena unei relaii de asociere dintre cele dou
variabile analizate.
Ipoteza alternativ presupune existena unei asociere dintre cele dou variabile.
n SPSS pentru a obine aceste valori precum i valoarea testului 2 se selecteaz din meniu
ANALYZE/DESCRIPTIVES STATISTICS/CROSSTABS, se introduce variabila pe linie i cea pe
coloan, apoi din opiunea Statistics se bifeaz Chi-square, iar din Cells/ Counts se alege Observed
(frecvenele observate) i Expected (cele ateptate).
Rezultatele din fiierul Outuput sunt prezentate mai jos.

Sex

masculin

feminin

Total

Count
Expected
Count
Count
Expected
Count
Count

Ct de mulumit(a) suntei de sntatea dvs.?.


Deloc
Nu prea
Destul de
Foarte
mulumit
mulumit
mulumit
mulumit
Total
100
252
482
161
995
136,4
285,7
436,5
136,4 995,0
174
137,6

322
288,3

395
440,5

274

574

877

43

113
1004
137,6 1004,0
274

1999

Sex

masculin

feminin

Total

Count
Expected
Count
Count
Expected
Count
Count
Expected
Count

Ct de mulumit(a) suntei de sntatea dvs.?.


Deloc
Nu prea
Destul de
Foarte
mulumit
mulumit
mulumit
mulumit
Total
100
252
482
161
995
136,4
285,7
436,5
136,4 995,0
174
137,6

322
288,3

395
440,5

113
1004
137,6 1004,0

274
274,0

574
574,0

877
877,0

274
1999
274,0 1999,0

n acest tabel 136,4 reprezint frecvena ateptat pentru csua (1,1) care este egal cu
produsul frecvenelor marginale pe primul rnd i prima coloan mprit la numrul total de subieci
(274*995/1999), iar celelalte valori se calculeaz similar.

Chi-Square Tests
Value
45,522a
45,850
43,368

df

Asymp. Sig. (2sided)


3
,000
3
,000
1
,000

Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases
1999
a. 0 cells (,0%) have expected count less than 5. The minimum
expected count is 136,38.
Valoarea calculat a testului 2 se compar cu cea critic care depinde de numrul de grade de
libertate. Numrul de grade de libertate gl= (r-1)*(c-1), unde r=nr. de rnduri, c=nr. de coloane.
Decizia se poate lua n dou moduri:
1) Se compar valoarea calculat a lui 2 cu cea critic pentru numrul de grade de libertate, si dac
2 calculat> 2 critic (care se ia din tabele standarde) atunci se respinge ipoteza de nul.
2) Alternativ dac nivelul de semnificaie (p sau Sig. cum este notat n SPSS) calculat este mai mic
dect 0,05 se respinge ipoteza de nul a independenei dintre variabile (cu o probabilitate de eroare
de 0,05).
Pentru tabelul anterior 2 =45,52, iar p=0,095. Fie comparm p cu 0,05 sau valoarea 2 cu cea critic
pentru 1 grad de libertate care este 3,8, concluzia la care ajungem este c respingem ipoteza de nul a
independenei dintre variabile. Cu alte cuvinte exist o relaie de asociere ntre cele dou variabile.

Valoarea rezidual standardizat i ajustat


Aceast msur se calculeaz pentru fiecare csu a tabelului pe baza formulei de calcul a
testului 2. Reziduul standardizat i ajustat are avantajul c ne permite identificarea relaiilor de
asociere chiar dac ele nu caracterizeaz tabelul n ansamblu, ci numai dou valori particulare ale
variabilelor.

44

Formula 2. Valoarea rezidual ajustat i standardizat

Fobservate Fasteptate
Fasteptate

Dac pentru o celul a tabelului valoarea rezidual standardizat ajustat este n afara
intervalului [-1.96;+1.96] atunci cu o probabilitate de eroare de 5% se poate susine c frecvena
observat este semnificativ mai mare dect cea ateptat n cazul independenei ntre variabile, deci se
presupune c exist o asociere ntre aceste dou valori ale variabilelor. Dac valoarea rezidual
ajustat se afl n interiorul intervalului se accept H0.
Pentru cazul anterior valorile sunt urmtoarele:
Adjusted Residual

Sexul
respondentului

masculin

Ct de mulumit(a) suntei de sntatea dvs.?


Deloc
Nu prea
Destul de
Foarte
mulumit
mulumit
mulumit
mulumit
-4,7
-3,3
4,1
3,2

feminin
4,7
3,3
-4,1
-3,2
Aceste
valori
se
obin
n
SPSS
din
ANALYZE/DESCRIPTIVES
STATISTICS/CROSSTABS/CELLS, apoi se selecteaz Residuals i se bifeaz Adj. Standardized.
Interpretare. Deducem deci c exist o asociere pozitiv ntre persoanele de sex masculin i
mulumirea fa de sntate i persoanele de sex feminin i nemulumirea fa de sntate
n SPSS TESTUL 2 se face din....

45

46

Iar valoarea rezidual ajustat i standardizat din...

47

11.2. Analiza variabilelor msurate la nivel de interval sau raport


11.2.1.Grafice realizate ntre variabile msurate la nivel de interval sau raport
Graficele realizate pe dou variabile cantitative sunt cele de tip SCATTER/DOT din meniul
CHART BUILDER.
Am luat ca exemplu dou variabile cantitative din Barometrul de opinie public octombrie
2007, vrsta i numr hectare pmnt pe gospodrie.
Interpretare. Se observ c persoanele care au peste 5 hectare de pmnt au vrste peste 40
de ani.

11.2.2.Coeficieni de asociere ntre variabile msurate la nivel de interval sau raport


Coeficientul r a lui Pearson se folosete pentru a testa relaiile dintre dou variabile
cantitative.
n

(x
i 1

x )( y i y )
n x y

unde, xi, yi reprezint valorile celor dou variabile,

x , y , reprezint mediile celor dou variabile


N, volumul eantionului iar x, y repezint deviaiile standard a celor dou variabile.
Acest coeficient are valori n intervalul [-1;+1] i cu ct valoarea coeficientului este mai
deprtat de valoare de zero cu att exist o relaie mai puternic ntre cele dou variabile.

48

n
SPSS
se
realizeaz
acest
coeficient
din
meniul
ANALYZE/DESCRIPTIVES/STATISTICS/ CROSSTABS iar aici se va bifa opiunea
CORRELATIONS. Pentru exemplificare, am luat variabilele prop1da i vrsta din baza de date din
Barometrul de opinie public octombrie 2007, care msoar numrul de hectare deinute de o persoan
i respectiv vrsta persoanei.
Symmetric Measures

Interval by
Pearson's R
Interval
Ordinal by
Spearman
Ordinal
Correlation
N of Valid Cases

Asymp. Appro Appro


Value Std. Errora x. Tb x. Sig.
,083
,034 2,313 ,021c
,160

,035 4,536

,000c

782

a. Not assuming the null hypothesis.


b. Using the asymptotic standard error assuming the null hypothesis.
c. Based on normal approximation.
Interpretare. Valoarea coeficientului este r=0.083 iar probabilitatea de testare a coeficientului
este p=0.021. Deoarece aceasta este mai mic dect 0,05 rezult c acest coeficient este semnificativ,
dei are o valoare apropiat de zero. Prin urmare putem spune c exist o relaie direct ntre vrst i
numrul de hectare deinute, dar destul de slab ca intensitate. Deoarece coeficientul este pozitiv,
putem aprecia c o dat cu creterea vrstei poate crete i numrul de hectare de pmnt deinute.

49