You are on page 1of 35

METODOLOGIA CERCETRII PEDAGOGICE

240






6. ANALIZA STATISTIC A DATELOR


Elaborarea i analiza sistemului de dimensiuni i indicatori, ca etape necesare ale
activitii de cercetare, au condus investigaia pn la nivelul contactului direct cu realitatea
concret i al culegerii datelor primare privind fenomenele cercetate. Parcurgnd aceste etape,
procesul msurrii dispune de:
a) un obiect al cercetrii precis delimitat n plan ontic i sintetizat n concepte cu
semnificaii clare, explicite i univoce, cu valoare denotativ ridicat;
b) un algoritm explicit de specificare a referinelor empirice ale conceptelor i de
identificare a elementelor concrete ce fac parte din sfera acestora.
Pe de alt parte, multe dintre datele numerice de care dispunem n etapa de colectare a
informaiilor exprim mrimi absolute, dimensiuni separate sau caracteristici unidimensionale
care, sub raportul valorii lor cognitive, sunt slab semnificative. Datele primare nregistrate n
etapa observrii nu permit, n forma lor brut, msurarea proporiilor i relaiilor dintre
diferite mrimi i diferite fenomene. Pentru acest tip de variabile, procesul msurrii continu
prin analiza datelor primare, prin gruparea, ordonarea i compararea acestora, prin construirea
unor indici care permit accesul la mrimile relative, la analiza structurii i dinamicii
fenomenelor.

6.1. Construirea i analiza indicatorilor statistici
n sens restrns, construirea indicatorilor statistici se refer numai la operaiile prin care
indicatorii operaionali care alctuiesc obiectul cercetrii sunt transpui n expresie numeric.
n acest sens, construirea indicatorilor statistici constituie o etap a procesului de msurare.
n sens larg, construirea indicatorilor statistici cuprinde i operaii de prelucrare care
continu msurarea efectuat la nivelul culegerii datelor cu msurarea efectuat prin analiza
datelor primare.

6.1.1. Ce sunt indicatorii statistici ?
Sintetic, indicatorul statistic poate fi definit drept expresia numeric a unor fenomene,
procese sau activiti, considerate n timp i n spaiu, n dinamic i n structur. Sub
aspectul rolului pe care l au n investigaia statistic, indicatorii statistici ndeplinesc un rol
similar cu cel al indicatorilor operaionali n cercetarea pedagogic. Indicatorii statistici sunt
purttori de informaii cu un coninut real, caracteristica lor distinctiv fiind aceea c aceste
informaii sunt sintetizate ntr-o form numeric.
Expresia numeric a indicatorilor statistici este rezultatul unui act de msurare a
fenomenelor sau caracteristicilor desemnate i investigate prin indicatorii operaionali ai
cercetrii. Este necesar deci s avem n vedere deosebirea ntre indicatorul statistic, ca
expresie numeric, i indicatorul operaional, ca fapt sau ca informaie exprimat cantitativ
prin indicatorul statistic respectiv. Dac, de exemplu, indicatorul operaional este un indicator
privind opiniile, indicatorul statistic poate fi o scal a opiniilor exprimat numeric printr-o
Analiza statistic a datelor


241
scal de ranguri. De la indicatorul operaional (care const n rspunsurile la o ntrebare sau
un set de ntrebri ntr-un chestionar) la indicatorul statistic, trecerea se face prin aplicarea
unui anumit procedeu de msurare. Rezult c, dei indicatorul statistic are n principiu un
coninut real, valoarea cognitiv a acestui coninut depinde:
- att de calitatea datelor privind indicatorul operaional (de pild, de calitatea
chestionarului utilizat);
- ct i de corectitudinea sistemului de msurare, de gradul n care acesta reflect corect
i fidel proprietile cantitative ale fenomenului msurat.
Pentru indicatorii care desemneaz mrimi ce pot fi observate i nregistrate ca atare sau
caracteristici direct msurabile, (de pild, indicatorii privind parametrii dezvoltrii biofizice a
elevilor, numrul elevilor dintr-o clas, durata unei activiti etc.) lucrurile sunt relativ simple
iar problema corespondenei dintre indicatorul statistic i indicatorul operaional al cercetrii
practic nu se pune.
n cellalt caz ns, cnd indicatorii operaionali indic fenomene sau caracteristici care
nu pot fi msurate n mod direct, problema corespondenei dintre indicatorul statistic i
indicatorul operaional este o problem de maxim importan, de a crei rezolvare depinde
valoarea cognitiv a ntregului aparat de analiz statistic. Practic, cercettorul trebuie s
rspund urmtoarelor ntrebri:
- Care este nivelul de msurare permis de natura fenomenelor sau caracteristicilor ce se
msoar? n funcie de rspuns, se va stabili tipul de msur (nominal, ordinal, de
interval sau de proporii) i se va decide asupra tehnicilor statistice de prelucrare ce vor
fi utilizate ?
- Care este gradul de coresponden ntre expresia numeric a indicatorului statistic i
dimensiunile reale ale fenomenului sau caracteristicii msurate? Rspunsul la aceast
ntrebare implic evaluarea validitii, fidelitii i sensibilitii sistemului de msurare
folosit i, pe aceast baz, stabilirea intervalului de ncredere, a pragurilor de
semnificaie i, n general, a limitelor n care rezultatele msurrii vor fi folosite n
interpretarea datelor i formularea concluziilor ?

6.1.2. Indicatori primari i indicatori derivai
n funcie de etapa n care sunt construii i de tipul unitilor de msur n care sunt
exprimai, indicatorii statistici sunt de dou feluri: primari i derivai.
1. Indicatorii primari sunt construii n faza de observare i nregistrare a datelor, ei
reflect ceea ce este nemijlocit observabil i msurabil n realitatea investigat i se exprim
n uniti de msur concrete, aceleai cu ale caracteristicii msurate. Indicatorii primari
constituie datele de intrare ale sistemului de msurare i analiz statistic, n forma lor brut,
aa cum apar n fiele de observare, n formularele statistice, n chestionare etc. Ei rezult cel
mult dintr-un proces de prelucrare primar, constnd din nregistrare, numrare, nsumare,
cuprindere n tabele centralizatoare, fr ca aceste operaii s modifice natura mrimilor i
unitilor de msur n care indicatorii au fost exprimai n procesul observrii i nregistrrii.
2. Indicatorii derivai sunt indicatori construii prin operaii de comparare, sintetizare,
estimare, generalizare, efectuate asupra indicatorilor primari. Prin intermediul indicatorilor
derivai se depete nivelul caracteristicilor nemijlocit observabile, pentru a fi puse n
eviden relaiile dintre diferitele caracteristici sau dintre diferitele mrimi ale aceleiai
caracteristici, tendinele, manifestrile tipice, interdependenele, raporturile de cauzalitate,
condiionare sau influenare.
Astfel, numrul elevilor promovai dintr-o clas, punctajul obinut de un elev la un test,
notele colare obinute de un elev sau grup de elevi la nceputul i la sfritul anului colar
METODOLOGIA CERCETRII PEDAGOGICE


242
sunt exemple de indicatori primari din care, prin variate combinri, se pot obine indicatori
statistici derivai. De exemplu, numrul elevilor promovai poate fi raportat la efectivul total
al clasei obinndu-se un indicator de promovabilitate; punctajul obinut la test de cunotine
poate fi comparat cu punctajele obinute de ceilali elevi rezultnd un indicator al nivelului
intelectual al elevului; ntre notele obinute de elevi la nceputul i la sfritul anului colar se
poate face o comparare prin diferen sau prin raportare, obinndu-se un indicator al
progresului colar .a.m.d.
Referitor la noiunile de indicatori primari i indicatori derivai mai sunt necesare cteva
precizri:
- n primul rnd, trebuie artat c, n anumite situaii, o serie de indicatori derivai pot s
fie nregistrai n faza de observare statistic, adic n calitate de date primare ale
investigaiei. De exemplu, se pot colecta direct mediile colare ale elevilor, aa cum sunt
ele consemnate n cataloage. Mediile colare nu sunt ns, n sens strict, indicatori
primari ntruct rezult din notele individuale obinute de elevi printr-un proces de
prelucrare statistic. Recomandabil este s se ia n considerare ca indicatori primari
notele individuale i nu mediile colare.
- n al doilea rnd, trebuie artat c termenul de indicatori statistici derivai acoper o
gam larg de indicatori care, luat n accepiunea cea mai cuprinztoare, include
mrimile medii, mrimile de variaie, coeficienii de de corelaie, indicatorii de estimare
statistic etc.
Exist ns i un sens mai restrns al termenului de indicatori derivai, sens care limiteaz
sfera acestui tip de indicatori la actul msurrii, mai exact la actul prin care dobndesc
expresie numeric proprietile indirect msurabile sau cele care privesc structura, dinamica,
proporiile, adic elemente cantitative care nu se relev prin observaie sau msurare direct.
Indicatorii derivai apar, n aceast accepiune, ca rezultat al unor proceduri de msurare
bazate pe analiza, compararea, ordonarea datelor primare i construirea unor uniti de msur
i a unor etaloane mai mult sau mai puin convenionale.
De exemplu, n cazul aplicrii unui test de cunotine, punctajul obinut de un elev sau
grup de elevi este un indicator cantitativ primar care nu are semnificaia unei msuri. Dei are
form numeric, acest indicator nu este totui o msur ntruct lipsete elementul de
comparaie, criteriul de referin sau, n general, unitatea de msur standard care s fac
comparabile punctaje diferite.

6.1.3. Indicatori absolui i indicatori relativi
Aceste dou categorii de indicatori statistici se definesc n funcie de tipul de mrimi n
care sunt exprimai: absolute sau relative.
1. Indicatorii absolui sunt exprimai n mrimi absolute, adic n numere (cantiti,
niveluri), care msoar o singur caracteristic a unei uniti statistice sau a unei colectiviti,
ntr-un anumit moment. Indicatorii absolui se obin:
- prin observare i nregistrare direct, cnd se studiaz o singur unitate statistic;
- prin nsumarea direct a unitilor ce alctuiesc o colectivitate sau un fenomen complex.
2. Indicatorii relativi sunt indicatori exprimai n mrimi relative, adic n mrimi ce
rezult din compararea a doi indicatori absolui. Baza obiectiv a indicatorilor relativi o
constituie faptul c, n mod frecvent, nivelul aceleiai caracteristici difer de la o unitate la
alta, de la o colectivitate la alta sau de la un moment la altul. Trebuie s observm c ntre
clasificarea indicatorilor n absolui i relativi i clasificarea n primari i derivai exist multe
elemente comune n sensul c:
Analiza statistic a datelor


243
z
y
x =
y y x ' =
- indicatorii absolui sunt, n cea mai mare parte, indicatori primari, ntruct sunt obinui
n etapa observrii directe;
- indicatorii relativi sunt indicatori derivai, ntruct provin din prelucrarea datelor
primare.
n funcie de procedura de comparare a indicatorilor absolui, indicatorii relativi sunt de
dou feluri:
- indicatori de raport, cnd compararea const n raportarea a doi indicatori absolui,
adic:



- indicatori de diferen, cnd compararea const n diferena dintre dou niveluri diferite
ale aceluiai indicator absolut:


Se impune observaia c, n cazul indicatorilor calculai ca rapoarte, y i z pot s
desemneze fie dou niveluri diferite ale aceleiai caracteristici, fie dou caracteristici diferite.
Din punctul de vedere al modului de exprimare cantitativ, indicatorii relativi pot fi exprimai
prin:
- coeficieni sau uniti care arat numrul (ntreg sau fracionar) de uniti ale
indicatorului raportat ce revin unei singure uniti a indicatorului luat ca baz de
raportare;
- procente (promile, prodecimile sau procentimile) care arat cte uniti ale
indicatorului raportat revin la 100 (1.000, 10.000, 100.000) uniti ale indicatorului
luat ca baz de raportare.
Construirea indicatorilor relativi nu ridic probleme deosebite de calcul. n schimb, ridic
probleme n ceea ce privete temeiul logic i justificarea real a punerii n comparaie. Astfel,
nainte de a trece la calcularea unui indicator relativ, trebuie s ne asigurm dac:
- termenii raportului (indicatorii absolui) sunt comparabili, ceea ce implic analiza
atent a modului, locului, colectivitii pe care indicatorii absolui respectivi au fost
nregistrai i/sau msurai;
- punerea n comparaie este justificat logic sau empiric, ceea ce implic existena unei
raiuni suficiente sau a unei ipoteze plauzibile privind relaiile de coresponden, de
interdependen, de condiionare ntre mrimile indicatorilor absolui pui n
comparaie;
- baza de comparaie este bine aleas, adic dac ea corespunde relaiilor i
interdependenelor reale dintre mrimile comparate i dac produce informaii
semnificative despre structura, dinamica sau asocierea fenomenelor studiate.
Indicatorii relativi pot fi clasificai i n funcie de tipul mrimilor relative n care sunt
exprimai. n acest sens, prezentm n continuare principalele tipuri de mrimi relative cu care
se opereaz n statistica social.

6.1.3.1. Mrimile relative de structur
Mrimile relative de structur sunt acele mrimi care se determin atunci cnd
colectivitatea statistic a fost divizat sau este divizibil n grupe sau categorii n funcie de
una sau mai multe caracteristici, exprimnd raportul n care se afl o unitate sau un grup de
uniti ale colectivitii statistice fa de volumul total ale acesteia. n funcie de natura
caracteristicilor i de modul de msurare a acestora, mrimile relative de structur pot fi
calculate ca:

METODOLOGIA CERCETRII PEDAGOGICE


244
100 =
N
x
P
i
x
I
% 85 , 23 100
1765
421
4
= =
x
P
- ponderi sau greuti specifice pentru caracteristicile calitative (discrete), cnd datele
primare constau n numrul unitilor nregistrate n fiecare grup sau subgrup;
- frecvene relative, pentru caracteristicile cantitative, cnd datele primare se prezint ca
serie de distribuie de frecvene.
Aplicaie: S presupunem c se cunosc datele din tabelul 6.1. privind distribuia colectivitii
elevilor cu performan colar peste medie dintr-un liceu din punctul de vedere al nivelului
studiilor familiei (s-a considerat printele cu nivelul de studii cel mai nalt):
Tabelul nr. 6.1
Ani
Numrul elevilor cu performan colar peste medie care provin din
familii cu studii:
TOTAL Primare Gimnaziale Profesionale Liceale Postliceale Universitare
0 1 2 3 4 5 6 7
1990 7 120 750 421 112 355 1.765
1997 12 171 1432 681 315 1989 4.600
Mrimile relative de structur (exprimate n procente) calculate pe baza acestor date se prezint ca
n tabelul nr. 6.2.
Tabelul nr. 6.2
0 1 2 3 4 5 6 7
1990 0,39 6,79 42,49 23,85 6,34 20,11 100,00
1997 0,26 3,71 31,13 14,80 6,84 43,23 100,00
Datele din acest tabel au fost calculate prin formula:



n care:
i
x
P
= ponderea;
x
i
= categoria de studeni a cror pondere se calculeaz;
N = efectivul total al colectivitii.
Lund de pild cazul categoriei studii liceale, anul 1990, se obine:



6.1.3.2. Mrimile relative ale dinamicii
Mrimile relative ale dinamicii se determin pentru caracterizarea evoluiei n timp a
fenomenelor, calculndu-se ca raport ntre nivelurile aceluiai indicator absolut nregistrate n
dou perioade diferite: perioada de baz (sau nivelul iniial) i perioada curent (sau nivelul
actual).
Aplicaie: Folosind datele din aplicaia precedent tabelul nr. 2.2, se pot calcula indicii
relativi ai dinamicii pentru fiecare categorie de elevi, ca i pentru efectivul total al populaiei
elevilor din liceul respectiv, dup urmtoarea formul:
100
0
1
=
i
i
x
x
x
I
i
1
i
x

i
x
I = indicele dinamicii;
unde: = nivelul indicatorului n perioada curent;

0
i
x = nivelul indicatorului n perioada de baz.

Analiza statistic a datelor


245

Dac se va calcula, de pild, acest indice pentru a determina evoluia ntre anii 1990 (ca perioad
de baz) i 1997 (ca perioad curent), a categoriei cu studii liceale, se obine:
% 75 , 161 100
421
681
100
0
1
= = =
i
i
x
x
x
I
i

ceea ce nseamn c nivelul numrul elevilor performani provenii din familii cu studii liceale a
crescut n 1997 fa de 1990 cu 61,75% sau la 161,75%.
Calculnd dinamica general a numrului de studeni, se obine:
% 62 , 260 100
765 . 1
600 . 4
100
0
1
= = =
n
n
x
x
x
I
n


6.1.3.3. Mrimile relative de coordonare
Mrimile relative de coordonare se determin pentru caracterizarea legturilor existente
ntre nivelurile aceluiai indicator nregistrate fie pe grupurile aceleiai colectiviti, fie pe
colectiviti de acelai tip dar situate n spaii diferite. Se calculeaz ca raport ntre cele dou
niveluri ale indicatorului respectiv.
Aplicaie: Folosind datele din aplicaia anterioar (tabelul nr. 2.1) se pot determina diferii
indicatori relativi de coordonare. De pild, se poate raporta numrul elevilor performani provenii
din familii cu studii superioare la numrul elevilor performani provenii din familii cu coal
profesional, obinnd (la nivelul anului 1997) un indicator de coordonare (K):
% 89 , 138 100
432 . 1
989 . 1
100
3
6
3 / 6
= = =
x
x
K
ceea ce nseamn c la 100 de elevi performani provenii din familii cu nivel de coal
profesional revin aproximativ 139 de elevi performani provenii din familii cu studii superioare.
De remarcat c mrimile relative de coordonare au proprietatea de a fi reversibile, adic se pot
calcula prin inversarea termenilor raportului:
% 99 , 71 100
989 . 1
432 . 1
100
6
3
6 / 3
= = =
x
x
K
ceea ce nseamn c la 100 de elevi performani provenii din familii cu studii superioare revin 72
de elevi performani provenii din familii cu studii de nivelul colii profesionale.

6.1.3.4. Mrimile relative de intensitate
Mrimile relative de intensitate se determin ca raport ntre doi indicatori absolui diferii
ca natur, dar care se afl ntr-o anumit relaie de interdependen. Acest tip de mrimi se pot
determina att la nivelul fiecrei uniti statistice, ct i la nivelul fiecrei grupe sau al
colectivitii n ansamblul ei:
a) la nivelul fiecrei uniti, mrimile relative de intensitate se calculeaz ca raport ntre
cei doi indicatori absolui diferii:
i
i
i
z
y
x =

i exprim cte uniti ale indicatorului de la numrtor revin unei uniti a indicatorului de la
numitor;
K SUB {6/3}~=~{x SUB 6}over{x SUB 3}~ CDOT
~100~=~{1.989}over{1.432}~ CDOT ~100~=~138,89%
METODOLOGIA CERCETRII PEDAGOGICE


246
elev m / 25 , 1
1011
1267
269 395 347
357 500 410
2
= =
+ +
+ +
b) la nivelul colectivitii, mrimile relative de intensitate se obin ca medii ale indicatorilor
absolui comparai:
i
i
i
z
y
x

=

Aplicaie: S presupunem c n urma unui studiu ntocmit pentru fundamentarea deciziilor de
redistribuire a spaiilor de nvmnt i a bugetului de investiii pentru anul colar urmtor, s-au
obinut urmtoarele date privind situaia spaiilor de nvmnt, pe cicluri, n cadrul unui grup
colar: (vezi tabelul nr. 6.3)
Tabelul nr. 6.3
Cicluri de
nvmnt
Numr de
Elevi (z)
Spaii de nvmnt (y)
n m
2

Clasele I - IV 347 410
Clasele V - VIII 395 500
Clasele IX - XII 269 357
TOTAL 1.011 1.267
Pe baza datelor din tabel se pot determina mrimile relative de intensitate pentru fiecare subgrup a
populaiei colare, dup cum urmeaz:
Pentru clasele I IV elev m / 18 , 1
347
410
2
=
Pentru clasele V VIII elev m / 26 , 1
395
500
2
=
Pentru clasele IX XII elev m / 32 , 1
269
357
2
=
Pentru determinarea acestei mrimi relative la nivelul ntregii populaii a grupului colar nu se va
proceda prin nsumarea mrimilor relative pariale (calculate la nivelul subgrupelor), ci prin
nsumarea separat, att la numrtor ct i la numitor, a indicatorilor absolui (prin folosirea
rubricii TOTAL din tabel):



6.1.4. Indicatorii tendinei centrale
n analiza unei colecii de date, determinarea mrimilor medii, cunoscute i sub numele de
valori centrale sau valori ale tendinei centrale, reprezint primul pas n trecerea de la
analiza datelor individuale la integrarea lor sub forma unor indicatori sintetici. Exist n
statistic o teorie a mediei, ntemeiat pe principiul compensrii reciproce a influenei
factorilor ntmpltori, prin care se obine o purificare a seriei statistice i care exprim
caracteristicile ei principale printr-un numr restrns de indicatori. Deseori, indicatorii
tendinei centrale sunt suficieni pentru a desprinde concluzii privind caracteristicile
definitorii ale unei colecii de date.

6.1.4.1. Media aritmetic (m)
Aceast mrime central reprezint cea mai simpl modalitate de prelucrare a elementelor
unei serii statistice. n acest caz, operaia de acumulare a valorilor individuale ale
caracteristicii este adunarea, iar operaia de revenire la nivelul unitii sintetice este
mprirea. n raport cu tipul de serie statistic pentru care urmeaz s se determine media
aritmetic, aceasta poate fi:
x~=~{ SIGMA y SUB i}over{ SIGMA
z SUB i}
Analiza statistic a datelor


247
1. Media aritmetic simpl (m), reprezint raportul dintre suma valorilor individuale ale
seriei statistice i numrul lor (efectivul total) i se calculeaz conform relaiei:
N
x
N
x x x x
m
i n

=
+ + + +
=
...
3 2 1

unde: m = media aritmetic simpl;
x
1
, x
2
, x
3
,...,x
n
= valorile variabilei;
N = numrul total al valorilor individuale (efectivul total).
Analiznd relaia de calcul, se observ c suma tuturor nivelurilor individuale sub care s-a
nregistrat caracteristica este mprit la numrul unitilor pentru care s-a nregistrat acea
caracteristic. De remarcat faptul c pentru calculul mediei aritmetice nu este nevoie s se
cunoasc toate valorile individuale ale caracteristicii, fiind suficient cunoaterea sumei
acestor valori (x
i
) i numrul elementelor individuale (N) care au intrat n calcul.
Aplicaie : n funcie de natura datelor disponibile i de caracteristicile seriei statistice, media
aritmetic se poate calcula prin dou proceduri.
1. Prima procedur se aplic atunci cnd seria statistic precizeaz frecvena pentru fiecare
valoare a variabilei nregistrat n populaia investigat. Pentru exemplificare folosim datele din
tabelul nr. 6.4. n care:
- x este valoarea variabilei (scorul obinut de elevi la un test);
- f(x) este frecvena de apariie a fiecrei valori.
n acest caz, seria statistic este transpus sub forma unui tabel cu trei coloane, a treia coloan fiind
necesar pentru calculul produsului (nmulirii) fiecrei valori a variabilei cu frecvena de apariie.
Suma acestei coloane reprezint totalul (T) de la numitorul fraciei. Calculul mediei se efectueaz
conform relaiei:
20
150
3000
= = =
N
T
m
Tabelul nr. 6.4
x fx
fx x

10 1 10
11 2 22
12 2 24
13 4 52
14 5 70
15 6 60
16 8 128
17 10 170
18 23 234
19 16 304
20 18 360
21 15 315
22 13 286
23 10 230
24 7 168
25 5 125
26 5 130
27 4 108
28 3 84
29 2 58
30 1 30
N = 150 T = 2968
METODOLOGIA CERCETRII PEDAGOGICE


248
i
i i
n
n n
p
f
f x
f f f f
f x f x f x f x
m

=
+ + + +
+ + + +
=
...
...
3 2 1
3 3 2 2 1 1
20
150
3000
= = =
N
T
m
2. A doua procedur se aplic n cazul seriilor statistice mari (cu un numr mare de valori ale
variabilei, nregistrate pe eantioane cu efective mari). n acest caz, valorile variabilei sunt grupate
pe clase (intervale) de valori, fiecare clas fiind reprezentat de valoarea central a intervalului
(x
k
). Folosind datele din tabelul nr. 2.4 se construiete tabelul de calcul, care va cuprinde o coloan
cu valorile centrale respective (tabelul nr. 6.5), iar calculul mediei se efectueaz conform relaiei:



Tabelul nr. 6.5
x fx
k
x

k
x fx

8 - 10 1 9 9
11- 13 8 12 96
14 - 16 19 15 285
17 - 19 32 18 702
20 - 22 46 21 966
23 - 25 22 24 528
26 - 28 12 27 324
29 - 31 3 30 90
TOTAL N = 150 - T = 3000

2. Media aritmetic ponderat (mp) se utilizeaz pentru determinarea nivelului mediu
al seriilor statistice de frecvene, valoarea variabilelor fiind ponderat cu frecvenele
corespunztoare, conform relaiei:


unde: m
p
= media aritmetic ponderat;
x
1
, x
2
, x
3
,...,x
n
= valorile variabilelor;
f
1
, f
2
, f
3
,...,f
n
= frecvenele corespunztoare variabilelor x
1
, x
2
, x
3
,..., x
n
.
Aplicaie : S presupunem c se cere calcularea mediei generale pe coal la sfritul unui an
colar, datele primare fiind cele prezentate n tabelul nr. 6.6.
Tabelul nr. 6.6
Clasa Media clasei (x) Nr. Elevi f(x) x f(x)
IX A 8,60 28 240,80
IX B 8,32 34 282,88
X A 7,75 30 232,50
X B 9,20 36 331,20
XI A 8,12 28 227,36
XI B 8,60 30 258,00
XII A 9,02 32 288,64
XII B 9,20 34 312,80
TOTAL 68,81 252 2174,18
n cazul calculrii mediei aritmetice simple, s-ar obine:
601 , 8
8
81 , 68
= =

=
N
x
m
i

Avnd n vedere c efectivele de elevi ale celor 8 clase nu sunt egale, aceast medie nu
reprezint adevrata medie pe coal, deoarece contribuia fiecrei clase de elevi la stabilirea
mediei pe coal este dependent de efectivul ei. n acest caz este necesar calcularea mediei
aritmetice ponderate:
Analiza statistic a datelor


249
628 , 8
252
18 , 2174
= =

=
i
i i
p
f
f x
m
Ponderarea mediei se poate face nu numai n funcie efectivul eantioanelor sau de
frecvena valorilor variabilei, dar i n funcie de alte criterii, n baza crora se intenioneaz
s se mreasc sau s se reduc ponderea unei anumite valori a variabilei n determinarea
mediei unei serii de date. De exemplu, n cadrul sistemului creditelor de studii, practicat n
nvmntul superior, media de absolvire a anilor de studii se calculeaz nu ca medie
aritmetic simpl a notelor obinute de student la disciplinele de nvmnt, ci ca o medie
ponderat cu numrul de credite al fiecrei discipline. Prin intermediul acestei proceduri se
urmrete ca media s reflecte mai corect relaia dintre volumul de munc solicitat
studentului i semnificaia notelor obinute. Ideea este c semnificaia notei obinute la o
disciplin superior creditat, care implic deci un volum mare de munc, nu este aceeai cu a
notei obinut la o disciplin mai slab creditat, care implic deci un volum mai redus de
munc.

6.1.4.2. Mediana (M)
Mediana este o mrime medie de poziie folosit frecvent, alturi de media aritmetic, la
caracterizarea seriilor de distribuie. Ea reprezint valoarea central a unei serii ordonat
cresctor sau descresctor i care mparte termenii seriei n dou pri egale, 50% din termeni
avnd valori mai mici dect mediana i 50% valori mai mari. n cazul unei serii simple cu N
termeni, poziia medianei este dat de expresia:
2
1 +
=
N
P
M

Valoarea medianei ntr-o serie simpl cu un numr impar de termeni este tocmai termenul
central, iar ntr-o serie cu numr par de termeni, mediana se determin ca medie aritmetic
simpl a celor doi termeni centrali.
Aplicaie: Pentru exemplificare, s presupunem c rezultatele obinute de un grup de elevi la
un test de cunotine se prezint sub forma urmtoarei serii simple:
elev A B C D E F G H I
nota 6,2 6,4 7,2 7,5 8,2 8,6 9,1 9,3 9,6
Seria avnd un numr impar de termeni (N = 9), se poate calcula direct locul medianei:
5
2
1 9
2
1
=
+
=
+
=
N
P
M

ceea ce nseamn c poziia medianei corespunde celui de-al cincilea termen (termenul E), iar
valoarea ei este 8,2.
Relund datele din tabelul nr. 2.6, pentru a determina valoarea medianei se procedeaz mai
nti la ordonarea (cresctoare) termenilor seriei, respectiv:
Clasa XA XIA IXB IXA XIB XIIA XB XIIB
nota 7,55 8,12 8,32 8,60 8,70 9,02 9,20 9,20
Pentru calculul poziiei medianei se utilizeaz relaia:
5 , 4
2
1 8
2
1
=
+
=
+
=
N
P
M

METODOLOGIA CERCETRII PEDAGOGICE


250
Fiind vorba de o serie cu un numr par de termeni, valoarea medianei se plaseaz ntre valorile
termenilor de pe poziiile 4 i 5, deci ntre 8,60 i 8,70, pentru determinarea ei urmnd a fi calculat
media aritmetic a celor dou valori, respectiv:
65 , 8
2
30 , 17
2
70 , 8 60 , 8
= =
+
= M
Valoarea medianei este, de foarte multe ori, mai reprezentativ dect cea a mediei
aritmetice, ntruct indic valoarea de mijloc a variabilelor i permite stabilirea poziiei pe
care o anumit valoare individual o are n cadrul coleciei de date. n cazul unei serii
statistice cu distribuie normal, valoarea medianei corespunde punctului de maxim
amplitudine a curbei de distribuie, marcnd astfel i punctul de inflexiune a curbei.

6.1.4.3. Dominanta (D)
Dominanta reprezint valoarea caracteristicii cu frecvena cea mai mare. Uneori,
dominanta este denumit i cu termenul de mod sau de modl. Preferm termenul de
dominant, mai ales c de aceast denumire este legat i notaia caracteristicii (D).
n cazul seriilor cu distribuie normal (gaussian) valoarea dominantei este aproximativ
aceeai cu a medianei i a mediei aritmetice. n cazul seriilor cu distribuii asimetrice,
valoarea dominantei se poate plasa n orice poziie a seriei, corespunznd punctului de
inflexiune a curbei de distribuie.

6.1.4.4. Relaiile ntre medie, median i dominant
Cele trei valori tendinei centrale pot s coincid sau s fie apropiate ca valoare, situaie n
care colecia de date este distribuit normal n raport cu variabila studiat. Atunci cnd cele
trei sunt diferite, semnificaia fiecreia n caracterizarea seriei este i ea diferit, caz n care se
recomand ca pentru fiecare tip de repartiie s se considere ca reprezentativ una din mrimi,
i anume:
- n cazul seriilor cu repartiii asimetrice se recomand aprecierea seriei n funcie de
valoarea dominantei;
- n cazul seriilor cu repartiii simetrice se recomand caracterizarea seriei funcie de
valoarea medianei;
- n cazul seriilor n care este necesar a fi luate n considerare toate valorile
variabilelor, se recomand aprecierea seriei n funcie de valorile mediei aritmetice
sau ale mediei geometrice.
Maximum de informaii l ofer totui media, fapt pentru care ea trebuie s fie, n
general, preferat. G.U. Yule i M.G. Kendall (1969) au stabilit o relaie ntre cei trei
indicatorii ai tendinei centrale, de tipul:
D = m - 3 (m - M)
care este valabil n cazul repartiiilor moderat asimetrice. Din analiza expresiei rezult c, n
cazul repartiiilor moderat asimetrice, valoarea medianei este situat ntre valorile mediei i
dominantei, respectiv la o treime distan ntre medie i dominant, msurat de la medie.

6.1.5. Indicatorii de dispersie
Media, mediana i dominanta caracterizeaz un singur aspect al distribuiei, respectiv
tendina central a datelor. Pentru caracterizarea complex a unei colecii de date este ns
necesar i cunoaterea modului n care se repartizeaz diferitele rezultate n jurul valorii
centrale, respectiv organizarea intern a distribuiei. Indicatorii acestei caracteristici a seriei
sunt indicatorii dispersiei care, de regul, se ataeaz indicatorilor medii pentru a mbogi
Analiza statistic a datelor


251
informaia asupra variabilelor studiate. Indicatorii dispersiei pun n eviden gradul de
mprtiere sau dispersia valorilor variabilei n interiorul populaiei (sau coleciei de date)
studiate.

Aplicaie: Pentru exemplificare, s presupunem c n urma unei lucrri scrise aplicat la dou
clase cu efective identice (40 de elevi), au fost obinute rezultatele consemnate n tabelul nr. 6.7.
Tabelul nr. 6.7
Frecvene
Note
TOTAL
4 5 6 7 8 9 10
Clasa A 1 2 5 24 5 2 1 40
Clasa B 4 5 6 10 6 5 4 40
O prim observaie ce trebuie fcut este aceea c mediile celor dou clase sunt identice (m =
7). Cu toate acestea, dac se construiesc curbele distribuiei (figura nr. 6.1), se poate observa c
cele dou clase difer dup gradul de dispersie a notelor. La prima clas, omogenitatea este mai
mare, pe cnd la cea de-a doua, cu grad mare de dispersie, exist mai muli elevi buni dar i mai
muli elevi slabi.
4 5 6 7 8 9 10
Clasa A Clasa B

Figura nr. 2.1. Curbele de distribuie a dou serii cu medii egale,
dar cu dispersii diferite
Prin urmare, dac media reprezint sintetic ansamblul valorilor individuale, dispersia
exprim sintetic variaia nivelurilor individuale, respectiv modul n care se distribuie valorile
individuale n raport cu tendinele centrale ale seriei.

6.1.5.1. Amplitudinea intervalului de variaie (A)
Acest indicator reprezint cea mai simpl msur a dispersiei valorilor unei serii i const
n diferena dintre valoarea individual cea mai mare i valoarea individual cea mai mic a
caracteristicii studiate, indicnd astfel spaiul de variabilitate a caracteristicilor studiate.
Calculul amplitudinii se efectueaz n funcie de tipul mrimii care urmeaz a fi obinute,
respectiv:
a) ca mrime absolut, caz n care se utilizeaz relaia:
min max
x x A =

b) ca mrime relativ, caz n care se utilizeaz relaia:

; 100
min max

=
m
x x
A
unde m = media aritmetic.
METODOLOGIA CERCETRII PEDAGOGICE


252
Amplitudinea este un indicator rudimentar al dispersiei i nu ofer prea multe informaii
asupra seriei pentru care se calculeaz. Aceeai amplitudine poate s caracterizeze serii ale
cror distribuii grafice sunt total diferite. n general, la un numr determinat de observaii,
amplitudinea poate desemna un anumit grad de aplatizare a curbei pentru curbele simetrice i
moderat asimetrice.

6.1.5.2. Abaterea fiecrei variante de la medie (A
x
)
Acest indicator reprezint diferena fiecrei valori a seriei fa de media aritmetic a
acesteia, calculul abaterii putnd fi fcut fie n valoare absolut, conform relaiei:
m x A
i x
i
=

fie n valoare relativ (procentual), conform relaiei:
100

=
m
m x
A
i
x
i

unde: x
i
= valoarea variantei;
m = media aritmetic a seriei.
Acest indicator urmeaz a fi folosit pentru calculul abaterii medii.

6.1.5.3. Abaterea medie liniar (
m
)
Acest indicator reprezint media aritmetic a abaterilor valorilor individuale de la media
seriei, luate n mrime absolut, deci fr a se lua n considerare caracterul pozitiv sau
negativ al valorii abaterii, i se calculeaz astfel:
N
m x
i
m

A

unde: x
i
= valorile individuale ale termenilor seriei;
m = media aritmetic a seriei;
N = numrul de termeni ai seriei.

Aplicaie: n cazul seriilor statistice simple, n care este consemnat fiecare valoare
nregistrat a variabilei (chiar dac anumite valori se repet de mai multe ori) i, prin urmare,
frecvena fiecrei valori este egal cu 1, aplicarea formulei este direct i este analog cu calculul
mediei aritmetice simple. Pentru exemplificare, s presupunem c doi profesori evalueaz 10
lucrri scrise, iar notele acordate de fiecare se prezint ca n tabelul nr. 6.8 (tabel care cuprinde i
elementele necesare aplicrii formulei). Este de observat c media notelor acordate de ctre cei doi
profesori este aceeai ((m=8).
Tabelul nr. 6.8
Note acordate m xm
Profesorul A 5 6 6 7 8 9 9 10 10 10 8 -
xm 3 2 2 1 0 1 1 2 2 2 - 16
Profesorul B 6 7 7 8 8 8 9 9 9 9 8 -
xm 2 1 1 0 0 0 1 1 1 1 - 8
Rezult: n cazul profesorului A
6 , 1
10
16
= A
m
n cazul profesorului B 8 , 0
10
8
= A
m



Analiza statistic a datelor


253
60 , 0
40
24
= =

= A
N
m x
i
m
40 , 1
40
56
= =

= A
N
m x
i
m
n cazul seriilor statistice de frecvene, n care fiecare valoare nregistrat a caracteristicii este
consemnat o singur dat (ceea ce nseamn c dac anumite valori apar de mai multe ori este
consemnat frecvena de apariie a acestora), se procedeaz n mod analog cu calcului mediei
aritmetice ponderate.
De exemplu, pentru calculul dispersiei notelor obinute de elevii celor dou clase prezentate n
tabelul nr. 2.7 se procedeaz n modul urmtor (vezi tabelul nr.6.9)
- se calculeaz mai nti media aritmetic ponderat a notelor obinute:
0 , 7
40
280
= =

=
i
i i
p
f
f x
m
- se calculeaz valorile
i
x prin nmulirea fiecrei note cu frecvena ei (
i
x x fx );
- se calculeaz valorile m prin nmulirea fiecrei frecvene cu media aritmetic ( m m fx );
- se calculeaz diferenele m x
i
i suma acestora.
Tabelul nr. 6.9

Note (x) Elemente de calcul
4 5 6 7 8 9 10 N m m x
i

Clasa A(fx) 1 2 5 24 5 2 1 40 7 -
i
x x fx

4 10 30 168 40 18 10
-
- -
m m fx
7 14 35 168 35 14 7 - - -
m x
i


3 4 5 0 5 4 3
-
- 24
Clasa B(fx) 4 5 6 10 6 5 4 40 7 -
i
x x fx

16 25 36 70 48 45 40
-
- -
m m fx
28 35 42 70 42 35 28 - - -
m x
i


12 10 6 0 6 10 12
-
- 56

Prin aplicarea formulei de calcul se obin urmtoarele rezultate:

- n cazul clasei A:


- n cazul clasei B:
Acest indicator, cunoscut i sub numele de deviaie medie ofer o imagine asupra gradului
de omogenitate a colectivitii luate n studiu. n cazul exemplificat, diferena dintre valorile
abaterilor medii liniare reflect gradul de dispersie mai mare a notelor obinute de elevii din
clasa B (care formeaz un grup neomogen), faa de cei din clasa A (care formeaz un grup
mai omogen).

6.1.5.4. Dispersia sau variana (
2
)
Aceast mrime numit i abatere medie ptratic reprezint indicatorul sintetic de
baz al dispersiei i se calculeaz ca medie aritmetic a ptratelor abaterilor valorilor
individuale ale variabilei de la media aritmetic a seriei, conform relaiei:
( )
1
2
2


=
N
m x
i
o

METODOLOGIA CERCETRII PEDAGOGICE


254
Determinarea sumei patratelor reprezint o operaie laborioas, fapt pentru care relaia de
calcul a fost prelucrat, obinndu-se o formul mai convenabil, plecnd de la egalitatea:
( )
( )
N
x
x m x
i
i i
2
2 2

=

Prin nlocuire, relaia de calcul a dispersiei devine:
( )
1
2
2
2


=
N
N
x
x
i
i
o

Aplicaie: Folosind datele din tabelul nr. 6.9, pentru a calcula valoarea abaterii medii se
construiete un tabel de calcul cu datele necesare (vezi tabelul nr. 6.10).
Tabelul nr. 6.10
Note (x)

4 5 6 7 8 9 10
Clasa A(fx) 1 2 5 24 5 2 1 40
i
x x fx
4 10 30 168 40 18 10 280
2
i i
x x x
16 50 180 1176 320 162 100 2004
Clasa B(fx) 4 5 6 10 6 5 4 40
i
x x fx
16 25 36 70 48 45 40 280
2
i i
x x x
64 125 216 700 384 405 400 2294

Valoarea dispersiei pentru cele dou clase se va calcula astfel:
- pentru clasa A: 13 , 1
39
44
39
1960 2004
1 40
40
280
2004
2
2
= =

= o
- pentru clasa B: 56 , 8
39
334
1 40
1960 2294
1 40
40
280
2294
2
2
= =

= o

6.1.5.5. Abaterea standard ()
Acest indicator, cunoscut i sub numele de abatere tip sau abatere etalon, reprezint
rdcina ptrat a abaterii medii i se calculeaz conform relaiei:
( )
1
2
2


= =
N
m x
i
o o

Abaterea standard are avantajul de a fi exprimat n aceleai uniti de msur cu ale
datelor care au fost prelucrate. Folosind datele din tabelul nr. 2.10, abaterea standard se
calculeaz astfel:
- pentru clasa A: 06 , 1 13 , 1
2
= = = o o
- pentru clasa B: 92 , 2 56 , 8
2
= = = o o
Valoarea destul de mare a abaterii standard n cazul clasei B indic faptul c media nu
caracterizeaz bine grupul datorit faptului c acesta prezint un grad ridicat de eterogenitate.
n general, o valoarea mic a abaterii standard indic faptul c media caracterizeaz bine
seria.
Analiza statistic a datelor


255
6.1.5.6. Coeficientul de variaie (V)
Acest indicator reprezint o mrime relativ a dispersiei i se calculeaz conform relaiei:
100 =
m
V
o

Sub form procentual, indicele se folosete n analizele comparative. Plecnd de la
datele din aplicaia anterioar, valoarea coeficientului de variaie se calculeaz astfel:
- pentru clasa A: % 14 , 15 100
7
06 , 1
100 = = =
m
V
o

- pentru clasa B: % 71 , 41 100
7
92 , 2
100 = = =
m
V
o

Valoarea relativ mare a coeficientului de variaie pentru clasa B indic gradul ridicat de
mprtiere a datelor, ceea ce confirm datele oferite de ceilali indicatori ai dispersiei.

6.1.6. Indicatori ai corelaiei i asocierii
Analiza corelaiei const, n esen, n studiul variaiei paralele a variabilelor, fapt pentru
care unii specialiti prefer n locul termenului de corelaie pe cel de covariaie. Cele mai
multe formule de calcul al corelaiei sunt, de fapt, combinaii de dispersii. Trebuie totui
subliniat c este vorba doar despre o confirmare statistic a existenei unei co-variaii i nu
despre demonstrarea legturii reale dintre variabile. De aceea, interpretarea indicatorilor
statistici ai corelaiei trebuie integrat demersului teoretic i metodologic al cercetrii, ceea ce
presupune, drept condiii minimale:
- existena unei ipoteze plauzibile privind posibilitatea unei relaii de interdependen
dintre variabilele studiate;
- alegerea procedeului cel mai adecvat de cercetare a legturilor, procedeu care s
corespund naturii datelor i tipului de variabile (cantitative sau calitative);
- folosirea unor tehnici de eantionare adecvate tipului de variabile i naturii legturilor
studiate;
- folosirea unor tehnici de control n plan real (experimental) a variaiei variabilelor
(scheme experimentale, combinaii de eantioane etc.);
- folosirea unor tehnici i instrumente de msurare bine construite, care s asigure
corectitudinea i relevana datelor primare pe baza crora se calculeaz corelaia
statistic.
n cazul variabilelor a cror variaie poate fi exprimat numeric printr-o msurare ce
aproximeaz nivelul de interval sau nivelul de raport, se poate calcula coeficientul propriu-zis
de corelaie (metoda produselor), iar pentru variabilele msurabile la nivelul ordinal este
posibil calculul coeficientului corelaiei de rang. n cazul variabilelor a cror variaie poate fi
exprimat doar nominal (prin gruparea n clase i determinarea frecvenelor), studiul corelaiei
se limiteaz la studiul asocierii, prin calculul coeficienilor de asociere (sau de contingen).

6.1.6.1. Procedee analitice de studiere a corelaiei i asocierii
Folosirea unor procedee analitice simple de cercetare a formei i sensului corelaiilor este
necesar ca o etap iniial n care se poate stabili dac i prin ce tehnic trebuie aprofundat
calculul corelaiei (asocierii). Deseori ns, aceste procedee simple sunt suficiente pentru
sesizarea tendinelor i pentru formularea concluziilor.
1. Procedeul seriilor paralele const, practic, n transpunerea datelor privind variaia
variabilelor ntre care s-a presupus existena unor legturi sub forma a dou sau mai multe
METODOLOGIA CERCETRII PEDAGOGICE


256
serii statistice i compararea acestor serii. n acest scop, seria care reprezint variabila
independent (factorial sau cauzal) notat cu x, se ordoneaz cresctor sau descresctor,
iar n seria paralel se nscriu, pentru fiecare nivel sau interval, valorile corespunztoare ale
variabilei dependente (rezultative). n msura n care ordinea rezultat din valorile variabilei
dependente este similar sau apropiat cu ordinea din prima serie, se estimeaz existena
corelaiei (asocierii) dintre variabile.
2. Procedeul gruprilor este o form mai sintetic a procedeului seriilor paralele i
const n sistematizarea pe grupe a termenilor seriei astfel nct s se poat stabili anumite
trepte de comparaie. Aceste trepte pot fi stabilite pe baz teoretic sau prin analiza empiric
a datelor, astfel nct s se pun n eviden tipurile principale, semnificative pentru variaia
variabilelor ce se studiaz.
S presupunem, de exemplu, c un studiu ce vizeaz estimarea relaiei ntre numrul
orelor alocate pentru studiul individual i rezultatele obinute n sesiunea de examene pe un
eantion format din 50 de studeni, conduce la rezultatele prezentate n tabelul nr. 6.11, n care
numrul orelor de studiu individual este grupat pe 5 intervale, pentru fiecare interval fiind
stabilit media notelor obinute de studenii care au alocat un timp de studiu ncadrat n
limitele intervalului respectiv.
Acest procedeu de grupare a datelor atenueaz influena excepiilor i reflect mai bine,
datorit lurii n consideraie a mediei, tendina central a variabilei dependente (fx) pentru
fiecare grup de valori ale variabilei independente (x).

Tabelul nr. 6.11
Nr. ore studiu individual
/ sptmn (x)
Media obinut la examen
fx
6 - 10 5,70
11 - 15 6,50
16 - 20 7,90
21 - 25 8,70
26 - 30 9,50

3. Procedeul grafic este o modalitate simpl dar sugestiv de evideniere a corelaiei sau
asocierii, deseori suficient pentru susinerea unor concluzii. Dintre tipurile de grafice care
pot fi ntocmite, cel mai frecvent utilizat este cel al norilor de puncte, care const n
reprezentarea prin puncte a tuturor perechilor de valori corespunztoare celor dou variabile
ale cror corelaii se studiaz. Cnd numrul perechilor de variabile este mare rezult o
mulime de puncte, de unde i denumirea de nor de puncte (vezi figura nr. 2.2). Corelaia (sau
absena corelaiei) este pus n eviden de:
- forma norului de puncte;
- poziia norului de puncte n raport cu axele de coordonate.
Dac pe linia densitii maxime a norului de puncte se traseaz o dreapt care s mpart
punctele reprezentate n grafic n dou pri aproximativ egale, se obine dreapta de regresie,
a crei poziie i direcie indic tipul corelaiei (coordonatele dreptei de regresie se determin
prin calcule destul de complexe asupra crora nu insistm).


Analiza statistic a datelor


257

Figura nr. 6.2 Procedeul norilor de puncte


6.1.6.2. Metoda produselor
Metoda produselor este principala metod de calcul al coeficienilor de corelaie, numit
i metoda Bravais-Pearson (dup numele autorilor) i se bazeaz pe analiza comparativ a
distribuiilor de frecven corespunztoare variabilelor studiate. Relaia de calcul este
urmtoarea:
( )( )
( ) ( )
2 2
y i x i
y i x i
m y m x
m y m x
r


=

unde: r = coeficientul de corelaie;
m
x
= media aritmetic a variabilelor x;
m
y
= media aritmetic a variabilelor y.
ntruct calculul coeficientului de corelaie prin formula standard necesit operaii destul
de laborioase, a fost efectuat o prelucrare a ei. Pentru sumele de patrate care figureaz la
numitor s-au folosit urmtoarele egaliti:









a) lipsa corelaiei






b. corelaie moderat pozitiv c. corelaie moderat negativ











d. corelaie puternic pozitiv e. corelaie puternic negativ


METODOLOGIA CERCETRII PEDAGOGICE


258
( ) ( )
N
T
y m y
N
T
x m x
y
i y i
x
i x i
2
2 2
2
2 2
; = =

Pentru suma produselor care figureaz la numrtor, s-a folosit egalitatea:
( )( )
N
T T
y x m y m x
y x
i i y i x i
=

unde:

= =
i y i x
y T x T ;

Dup efectuarea nlocuirilor, relaia de calcul a coeficientului de corelaie este:
|
|
.
|

\
|

|
|
.
|

\
|


=
N
T
y
N
T
x
N
T T
y x
r
y
i
x
i
y x
i i
2
2
2
2

Coeficientul de corelaie poate lua numai valori subunitare, valoarea maxim pe care o
poarte avea, respectiv 1, indicnd corelaia perfect.

Aplicaie: S presupunem c se cere calculul coeficientului de corelaie ntre notele obinute la
matematic i notele obinute la fizic de ctre un eantion de elevi, datele primare fiind grupate ca
n tabelul nr. 6.12.
Tabel nr. 6.12
Subieci
Nota la
matematic
(x)
Nota la fizic
(y)
x2 y2 xy
A 7 7 49 49 49
B 9 8 81 64 72
C 10 9 100 81 90
D 6 7 36 49 42
E 9 10 81 100 90
F 8 7 64 49 56
G 5 6 25 36 30
H 3 4 9 16 12
I 7 6 49 36 42
J 8 7 64 49 56
K 6 7 36 49 42
L 7 7 49 49 49
M 6 6 36 36 36
N 5 6 25 36 30
N = 14
x
T = 96
y
T = 97
2
i
x = 704
2
i
y = 699
i i
y x = 696

Pe baza datelor din tabel, se calculeaz coeficientul de corelaie cu ajutorul relaiei prezentate:
88 , 0
1 , 35
9 , 30
14
97
699
14
96
704
14
97 96
696
2 2
= =
|
|
.
|

\
|

|
|
.
|

\
|

= r
Metoda produselor se aplic i n cazul seriilor statistice de frecven, calculele fiind mai
complexe, dar logica metodei este aceeai.
Analiza statistic a datelor


259
6.1.6.3. Metoda corelaiei rangurilor
Aceast metod se utilizeaz atunci cnd variaia variabilelor nu se exprim n uniti de
mrime ci n poziii sau n ranguri. Cu alte cuvinte, se cunoate ordinea ierarhic a mrimii
variabilelor, dar nu se cunoate unitatea de msur care exprim i desparte un nivel de altul.
Rangurile reprezint, de fapt, un tip de scale de ierarhizare n care fiecare element are locul
su, respectiv rangul su.
Metoda de calcul cunoscut i sub denumirea de metoda rangului lui Spearman (dup
numele autorului, Ch. Spearman) este urmtoarea:
( ) 1
6
1
2
2

=
N N
D


unde: = coeficientul de corelaie;
D = diferena de rang ntre cele dou variabile;
N = efectivul grupei (eantionului).
Coeficientul de corelaie cu att mai mic, cu ct diferenele de rang sunt mai mari.
Metoda rangurilor este utilizabil nu numai n cazul variabilelor ordinale, ci i n cazul n
care se compar dou variabile de naturi diferite (exprimate prin uniti de msur diferite),
care nu sunt direct comparabile. n acest caz, se renun la unitile de msur, respectiv la
unitile de mrime n care este exprimat variaia fiecrei variabile, i se reine numai
ordonarea (ierarhizarea) diferitelor valori.
Aplicaie: Pentru ilustrare, s presupunem c, n scopul stabilirii relaiei ntre aptitudinile
sportive i rezultatele colare, a fost luat n studiu un grup de 12 elevi care au fost ierarhizai pe
baza unor probe de educaie fizic.
n tabelul nr. 6.13 este prezentat ierarhizarea elevilor n funcie de cele dou variabile. De
observat c, n cazul siturii a doi sau mai muli elevi pe acelai loc, se folosesc, pentru stabilirea
rangului, numere fracionare. De pild, dac pe rangul 4 sunt doi subieci, fiecare va primi rangul
4,5, iar urmtorul rang va fi 6.
Tabelul nr. 6.13
Subieci
Aptitudini
sportive
Rezultate
colare
D D2
A 1 7 -6 36
B 2 1 1 1
C 3 3 0,00 0,00
D 4,5 5,5 -1 1
E 4,5 5,5 -1 1
F 6 12 -6 36
G 7,5 9 -2,5 6,25
H 7,5 8 -0,5 0,25
I 9 10 -1 1
J 10 10 0,00 0,00
K 11 2 9 81
L 12 4 8 64
N = 12
2
D = 227,5
Pe baza datelor din tabel, coeficientul de corelaie este:
( )
21 , 0 79 , 0 1
1 144 12
5 , 227 6
1 = =

=

Valoarea coeficientului de corelaie (0,21) indic o corelaie neglijabil spre foarte redus.
METODOLOGIA CERCETRII PEDAGOGICE


260
Semnificaia valorilor coeficientului de corelaie a rangurilor poate fi pus n
coresponden cu semnificaia valorilor coeficientului calculat prin metoda produselor (r) pe
baza unor tabele speciale de coresponden. De regul, la acelai prag de semnificaie,
coeficientul rangurilor este ceva mai mic dect coeficientul produselor. Valorile celor doi
coeficieni se nscriu n intervalul {-1; +1}, valorile pozitive apropiate de (+1) indicnd o
corelaie direct puternic, iar valorile negative apropiate de (-1) indicnd o corelaie invers.
Valorile apropiate de 0 (zero) nu sugereaz ipoteze determinate.
Orientativ, interpretarea coeficienilor de corelaie se poate face pe baza recomandrilor
din tabelul nr. 6.14:
Tabelul nr.6 2.14
Valori Semnificaie
0,00-0,20 corelaie neglijabil
0,20-0,40 corelaie prezent, dar redus
0,40-0,70 corelaie moderat, dar semnificativ
0,70-0,90 corelaie ridicat, semnificativ
0,90-1,00
corelaie foarte ridicat, foarte
semnificativ

6.1.6.4. Coeficientul de asociaie (q)
Acest indice al corelaiei a fost introdus de G.V. Yule (1969) i este aplicabil n cazul
variabilelor dihotomice, a cror variaie poate fi surprins numai prin gruparea datelor n dou
clase, ceea ce implic existena a patru valori, aezate n ptrat ca n tabelul nr. 6.15. Tocmai
datorit acestei caracteristici, coeficientul mai este denumit i coeficient al corelaiei
tetrahorice, relaia de calcul fiind:
bc ad
bc ad
q
+

=

Tabelul nr. 6.15
Y non Y
X a b
non X c d
Valorile coeficientului se ncadreaz n intervalul [-1; +1] iar interpretarea lor este
similar cu cea a coeficientului de corelaie.
Aplicaie: S presupunem c, n urma unui concurs de admitere n universitate, s-a studiat, pe
un eantion de 1000 de candidai, existena unei posibile relaii ntre mediul de origine a
candidailor (urban, rural) i reuita acestora la concurs. n urma gruprii, datele se prezint ca n
tabelul nr. 6.16.
Tabelul nr. 6.16

Y mediul
urban
non Y mediul
rural
X admii
a
471
b
151
non X respini
c
148
d
230

nlocuind valorile n relaia de calcul a coeficientului, se obine:
Analiza statistic a datelor


261
66 , 0
130678
85982
148 151 230 471
148 151 230 471
= =
+

= q

Valoarea 0,66 este destul de semnificativ i arat c originea social n mediul urban i
reuita la universitate sunt dou caracteristici pozitiv asociate.
Trebuie s remarcm c, n calculul coeficientului de asociaie, se ia ntotdeauna drept
corespondent al lui a valoarea de la intersecia celor dou caracteristici ntre care se studiaz
asocierea. Dac, de pild, se studiaz asocierea dintre originea n mediul rural i reuita la
universitate, formula de calcul va fi:

ad bc
ad bc
q
+

=
, iar rezultatul calculului va fi: 66 , 0
130678
85982
230 471 148 151
230 471 148 151
=

=
+

= q ,

ceea ce nseamn c originea social n mediul rural i reuita la universitate sunt dou
caracteristici negativ asociate.



6.2. Evaluarea i interpretarea statistic a datelor

Dup cum am artat n capitolul dedicat msurrii, evaluarea instrumentelor de msurare
sunt demersuri care sporesc corectitudinea i rigoarea la nivelul msurrii iniiale i al
producerii datelor primare. Aceasta nseamn c, folosind, de pild, un test bine construit i cu
condiiile de validitate, fidelitate i sensibilitate verificate, crete ansa ca datele produse de
aplicarea testului s reflecte corect i suficient de riguros variaia valorilor reale ale
caracteristicii msurate cu testul respectiv.
De regul ns, cercetarea nu se oprete aici. Testul respectiv poate fi o tehnic, alturi de
alte tehnici, integrat ntr-o cercetare complex care vizeaz mai mult dect variabila
msurat de test i mai mult dect eantionul pe care s-a aplicat testul. n acest caz, se ridic
ntrebarea: Care este semnificaia rezultatelor produse de aplicarea testului n contextul
datelor obinute prin celelalte tehnici sau pe eantioane diferite?
Aceast problem apare n mod foarte evident n cazul cercetrilor experimentale. De
exemplu, media statistic a scorurilor obinute de membrii unui grup experimental la un test
de cunotine, n urma unui experiment cu o metod special de nvare, nu este suficient
pentru a evalua eficiena metodei experimentate, ntruct trebuie cunoscut i modul n care se
raporteaz aceast medie la media obinut la acelai test de un grup de control cu care s-a
lucrat n alt mod, cu alt metod de nvare. Dac ntre mediile obinute de cele dou grupuri
apar diferene, se ridic ntrebarea: Sunt aceste diferene suficient de mari (sau de mici) pentru
a susine confirmarea (sau infirmarea) ipotezei experimentale? Problema se pune nu numai n
cazul folosirii unui test, ci pentru orice alt tehnic sau modalitate de msurare, ncepnd cu
simpla numrare i determinare a frecvenei, pn la msurarea asocierilor i corelaiilor.
Necesitatea evalurii i interpretrii statistice a datelor se impune i datorit faptului c, n
cele mai multe cazuri, cercetrile educaionale sunt o cercetri selective, n sensul c, dei
implic investigaii pe eantioane sau grupuri mai mult sau mai puin restrnse, vizeaz
formularea unor concluzii valabile sau aplicabile pentru populaii mai largi, de regul pentru
populaia sau colectivitatea statistic pentru care eantioanele sau grupurile respective sunt
(sau se consider c sunt) reprezentative. Datorit acestei particulariti, msurarea nsi este
selectiv; ea se efectueaz pe eantioane sau pe segmente ale mrimilor msurate.
Extrapolarea de la eantion la populaie total i de la segmentul de mrime la mrimea total
nu este ns lipsit de riscul erorii. n acest context, evaluarea i interpretarea statistic a
datelor au rolul de a msura i de a controla acest risc.

METODOLOGIA CERCETRII PEDAGOGICE


262

6.2.1. Evaluarea datelor prin estimarea statistic
Pentru relevarea semnificaiei estimrii statistice a datelor vom apela la un exemplu: s
presupunem c, n urma unei investigaii privind rspndirea tulburrilor de vorbire la copiii
de vrst colar mic efectuat pe un eantion de 3000 de copii, au fost nregistrate 11 cazuri
de tulburri grave, 27 cazuri de tulburri medii i 114 cazuri de tulburri uoare. Se pune
ntrebarea: n ce limite se poate afirma c frecvena tulburrilor stabilite pe eantion este
valabil i n cazul populaiei totale a colarilor mici dintr-un ora, dintr-o zon sau la
nivelul rii ?
n ali termeni, problema vizeaz msura n care eantionul este reprezentativ pentru
populaia total, iar, n legtur cu reprezentativitatea eantionului, problema vizeaz
probabilitatea erorii n extrapolarea datelor de la eantion la populaie.
La prima vedere, s-ar putea crede c volumul (mrimea) eantionului n raport cu volumul
(mrimea) populaiei totale este factorul decisiv pentru diminuarea erorilor, cci, evident,
problema nu s-ar pune dac investigaia ar cuprinde ntreaga populaie. Experiena
investigaiilor sociologice, n special a sondajelor de opinie, a artat ns c raportul dintre
mrimea eantionului i mrimea populaiei din care a fost selectat, respectiv ponderea
eantionului n totalul populaiei, nu au o importan hotrtoare i c factorii care
influeneaz probabilitatea erorii n trecerea de la eantion la populaie sunt:
a) volumul absolut al eantionului;
b) tehnica de eantionare.
Experiena sondajelor de opinie a relevat, de exemplu, c probabilitatea de eroare a unui
eantion naional pentru S.U.A, n mrime de 100 de persoane este de 15%, un eantion de
900 de persoane d o probabilitate de eroare de 5% iar un eantion de 10.000 de persoane
prezint un grad de eroare de 1,5%, limit dincolo de care o cretere a volumului eantionului
nu mai aduce un spor semnificativ de reprezentativitate. O formul simpl de calcul al
probabilitii de eroare (O
p
) este urmtoarea:
N
pq
N
p p
O
p
=

=
) 100 (

unde: p = procentul celor care exprim o anumit opinie;
q = 100 - p;
N = volumul (efectivul) eantionului.
Dac de exemplu, dintr-un eantion de 2400 persoane, 960 (respectiv 40%) exprim
opinia A, probabilitatea ca 40% din totalul populaiei din care a fost extras eantionul s
exprime aceeai opinie este:
% 1
2400
2400
2400
60 40
2400
) 40 100 ( 40
= =

=
p
O

ceea ce nsemn c probabilitatea de eroare este de 1%, respectiv, ponderea celor care vor
exprima aceeai opinie A din totalul populaiei poate oscila ntre 39-41%.

6.2.1.1. Estimarea statistic i proprietile distribuiei normale
ntruct cea mai mare parte a tehnicilor de estimare se bazeaz pe proprietile distribuiei
gaussiene (normale), sunt necesare, pentru nceput, cteva precizri referitoare la proprietile
acesteia. n acest sens, s-a stabilit c:
- intervalul 1,96 acoper 95% din rezultatele obinute pe o colecie de cazuri;
- intervalul 2,58 acoper 99% din rezultate.
Altfel spus, 5%, respectiv 1% din rezultate cad n afara intervalelor menionate.
Analiza statistic a datelor


263
De exemplu, dac o distribuie are urmtoarele caracteristici:
- media aritmetic m = 10;
- abaterea standard = 1;
- efectivul eantionului N = 100;
atunci 95 din elementele distribuiei cad n intervalul 8,04 11,96 (ntruct 10 - 1,96 1 =
8,04, iar 10 + 1,96 1 = 11,96), iar 5 elemente cad n afara acestui interval.

95%
2,5%
-2,58 -1,96
m -2,58 -1,96
2,5%

Figura nr. 6.3 Intervalele de probabilitate ale curbei distribuiei normale

Traducnd n limbajul probabilitilor, aceasta nsemn c:
- exist probabilitatea ca n 95 de cazuri n care se alege un element la ntmplare,
acesta s cad n intervalul {-1,96; +1,96}, aa cum n 5% din cazuri exist
probabilitatea ca acesta s cad n afara intervalului;
- n mod analog, exist probabilitatea de 99% ca elementul s cad n intervalul {-
2,58; +2,58}, aa cum n 1% din cazuri exist probabilitatea ca acesta s cad n
afara intervalului.
Intervalul astfel calculat poart numele de interval de ncredere, iar probabilitatea luat n
considerare poart numele de prag de semnificaie (P), a crui valoare este exprimat n cifre
absolute, respectiv 0,05 i 0,01. Relaia dintre cele dou valori este sintetizat n tabelul nr.
6.17.

Tabelul nr.6.17.
Prag de semnificaie (P) Interval de ncredere
0,05 {-1,96; +1,96}
0,01 {-2,58; +2,58}


6.2.1.2. Semnificaia unei medii
Semnificaia sau fidelitatea unei medii depinde de volumul eantionului studiat (N) i de
variabilitatea colectivitii () din care a fost selectat eantionul, n sensul c dac volumul
eantionului crete, media devine mai stabil i mai reprezentativ.
Estimarea semnificaiei unei medii se ntemeiaz pe premisa c, n cazul n care dintr-o
populaie se selecteaz mai multe eantioane, avnd fiecare acelai volum (N), mediile
METODOLOGIA CERCETRII PEDAGOGICE


264
calculate pentru fiecare eantion (m
1
, m
2
,...,m
n
), notate cu (m'), vor prezenta o distribuie
normal. Aceasta nseamn c mediile calculate vor oscila n jurul mediei reale (m), abaterea
standard a mediilor (
m
) avnd ca expresie:
E
N
m
= =
o
o

valoarea abaterii fiind denumit eroare standard (E). Cu ajutorul erorii standard se pot
determina limitele intervalului de ncredere, respectiv amplitudinea intervalului de ncredere,
i anume:
- intervalul de ncredere pentru P =0,005:
- lim.inf. = m'- 1,96E;
- lim.sup. = m' + 1,96E
- intervalul de ncredere pentru P =0,001
- lim.inf. = m'- 2,58E;
- lim.sup. = m' + 2,58E
Aplicaie: n cazul unui eantion extras dintr-o populaie avnd:
N = 51, m' = 13.17, = 4,74,
dac se pune problema determinrii intervalului de ncredere pentru pragul de semnificaie P =
0,005, demersul este urmtorul:
- se calculeaz eroarea standard: 66 , 0
14 , 7
74 , 4
51
74 , 4
= = = =
N
E
o

- se determin limitele intervalului de ncredere:
- lim.inf = 13,17 - 1,96 0,66 = 13,17 - 1,29 = 11,88;
- lim.sup = 13,17 + 1.96 0,66 = 13,17 + 1,29 = 14,46.
Media real a caracteristicii studiate pentru ntreaga populaie va fi cuprins n intervalul
11,88-14,46, ns exist probabilitatea ca 5% din mediile eantioanelor extrase din aceeai
populaie s nu se nscrie n acest interval, avnd n vedere pragul de semnificaie pentru care au
fost calculate limitele intervalului de ncredere, respectiv P = 0,005.
Acelai calcul se poate efectua i dac se alege un alt prag de probabilitate, spre exemplu: P =
0,001, caz n care limitele n care se nscrie media populaiei, cu riscul ca 1% din mediile
eantioanelor s nu intre n acest interval, este:
- lim.inf = 13,17 - 2,580,66 = 13,17 - 1,50 = 11,67;
- lim.inf = 13,17 + 2,580,66 = 13,17 + 1,50 + 14,67.
n acest caz intervalul de ncredere este: 11,67-14,67.

6.2.1.3. Semnificaia relaiei dintre medie i abaterea standard
n cele ce urmeaz vom insista asupra proprietilor mediei i abaterii standard, precum i
asupra relaiilor dintre aceti indicatori, ntruct deseori cunoaterea celor doi indicatori
sintetici este suficient pentru caracterizarea unui eantion sau colecii de cazuri, ca i pentru
plasarea unui subiect sau grup de subieci n distribuia colectivitii (eantionului) din care
fac parte.
n acest sens, revenim, pe scurt, asupra semnificaiei abaterii standard i a mediei
aritmetice pentru cazul unei distribuii normale. Sub acest aspect, s-a demonstrat c n cazul n
care distribuia este normal (simetric) sau apropiat de aceast form, atunci m 2 (mai
exact m 1,98) acoper 95% din cazurile (subiecii, elementele) ce alctuiesc efectivul total
(N), iar m 2,58 acoper 99% din cazuri. Lucrnd cu multiplii ntregi ai lui , relaiile dintre
medie i abaterea standard au semnificaia din graficul prezentat n figura nr. 6.4.
Analiza statistic a datelor


265

95%
68,26%
34,13%
13,86%
2,5%
34,13%
13,86% 13,86%
2,5%
-3 -2 -1 m +1 +2 +3

Figura nr. 6.4 Interpretarea abaterii standard
Aplicaie: S presupunem c la o clas de elevi se cunosc media aritmetic i abaterea
standard ale notelor colare, acestea fiind: m = 7,80 i = 0,70.
Dac distribuia clasei n funcie de notele colare este normal (sau apropiat), atunci se pot
determina, pe baza mediei, abaterii standard i a relaiilor dintre ele, urmtoarele date despre clasa
respectiv:
- amplitudinea intervalului de variaie (A), care se situeaz aproximativ ntre m - 3 i m + 3
(deoarece A=6), adic n cazul de fa, ntre notele 5,70 i 9,90 ntruct:
90 , 9 70 , 0 3 80 , 7 3
70 , 5 70 , 0 3 80 , 7 3
= + = +
= =
o
o
m
m

- dac efectivul clasei este de 36 de elevi, atunci se pot aproxima tranele (efectivele) de elevi
situai ntre diferitele intervale ale notelor colare, n modul urmtor:
- ntre 5,40 6,40 1 elev (2,5%);
- ntre 6,40 7,10 5 elevi (13,86%);
- ntre 7,10 7,80 12 elevi (34%);
- ntre 7,80 8,50 12 elevi (34%);
- ntre 8,50 9,20 5 elevi (13,86%);
- ntre 9,20 9,20 1 elev (2,5%)
Firete c pe baza datelor de mai sus, cunoaterea mediei colare pe care un anumit elev o are
permite plasarea lui n colectivul clasei sub aspectul performanei colare. De pild, despre un elev
cu media 8,10 se poate spune c se situeaz aproximativ ntre al aptelea i al optsprezecelea elev ai
clasei. Desigur, diferenierea este mai slab la mijlocul intervalului, dar mai puternic la extreme.
Astfel, despre un elev cu media sub 6,40 se poate afirma cu certitudine c este ntre ultimii 2-3
elevi din clas.

Semnificaia abaterii standard i relaiile ei cu media aritmetic are o deosebit utilitate n
analiza i interpretarea datelor rezultate din aplicarea unor probe pe eantioane reprezentative.
De exemplu, n urma aplicrii pe un eantion de 100 de elevi a unui set de probe de cunotine
generale, cu un punctaj situat n limitele 1-48 puncte, s-a obinut o distribuie de frecven (pe
clase de valori) conform tabelului nr. 6.18. n urma calculelor s-au obinut: m = 27,75 i =
8,60.





METODOLOGIA CERCETRII PEDAGOGICE


266
Tabelul nr. 6.18
X
(Clasa de
valori)
Xx
(Valoarea
central)

f(x)
9 - 13 11 5
14 - 18 16 11
19 - 23 21 15
24 - 28 26 22
29 - 33 31 21
34 - 38 36 15
39 - 43 41 8
44 - 48 46 3

Pe baza acestor valori i a relaiei dintre media i abaterea standard, s-a construit graficul
din figura nr. 6.5. Folosind cei doi indicatori se vor putea compara rezultatele obinute pe un
eantion oarecare cu cele obinute pe eantionul etalon, dup cum va fi posibil ca rezultatele
unui anumit elev s fie plasate n distribuia etalon.
2
4
6
8
10
12
14
16
18
20
22
24
9-13 14-18 19-23 24-28 29-33 34-38 39-43 44-48
-1 +1
-2 +2
19,15 36,35
10,55 44,95
m=27,75

Figura nr. 6.5

6.2.1.4. Semnificaia unei frecvene sau a unui procent
Pentru estimarea semnificaiei unei frecvene se lucreaz cu frecvene relative, calculate
cu formula:
100
a
r
f
f =

unde: fr = frecvena relativ;
fa = frecvena absolut.
Analiza statistic a datelor


267
n legtur cu aceast frecven, care n continuare va fi notat cu f, se pot face
urmtoarele consideraii:
- dac volumul eantionului (N) nu depete 100 de subieci, iar frecvena relativ nu
este prea aproape de 0 (zero) sau 1, atunci distribuia frecvenelor este practic normal;
- dac volumul eantionului este mare (peste 100), limitele de ncredere la pragul de
semnificaie P = 0,005 vor fi determinate funcie de eroarea standard a frecvenei
(Ef), care se calculeaz conform relaiei:
N
f f
E
f
) 1 (
=

iar limitele intervalului de variaie a frecvenei vor fi:
- lim.inf. = f - 1,96 E
f
;
- lim.sup. = f + 1,96 E
f

Aplicaie: S presupunem c se studiaz problema tulburrilor de vorbire la un grup de copii
din clasa I, avnd: N = 804 i f
a
= 105, ceea ce nseamn c volumul eantionului este de 804 copii,
iar numrul celor cu deficiene de vorbire este de 105. Problema este n ce msur aceast frecven
este caracteristic tuturor copiilor de clasa I. Pentru estimarea semnificaiei frecvenei respective se
procedeaz n modul urmtor:
- se calculeaz frecvena relativ a copiilor cu deficiene de vorbire:
131 , 0
804
105
100
= = =
a
f
f

- se calculeaz eroarea standard a frecvenei:
011 , 0
804
114 , 0
804
869 , 0 131 , 0
804
) 131 , 0 1 ( 131 , 0
= =

=
f
E

- se determin limitele intervalului de ncredere pentru P = 0,005:
- lim.inf. = 0,131 - 1,96 0,011 = 0,131 - 0,00216 = 0,109
- lim.sup. = 0,131 + 1,96 0,011 = 0,131 + 0,00216 = 0,152
n concluzie, se poate estima c ntr-un grup ales aleator de 804 copii de clasa I exist ntre
109 i 152 copii cu deficiene de vorbire, existnd totui probabilitatea ca la 5% din grupuri
frecvena s cad n afara acestui interval.

6.2.1.5. Semnificaia unui coeficient de corelaie
Problema care se ridic n cazul coeficienilor de corelaie este aceea dac un coeficient
calculat experimental permite s se afirme c exist sau nu o corelaie ntre seriile statistice
pentru care s-a calculat coeficientul. n acest sens se folosete coeficientul de corelaie minim
(sau critic), respectiv valoarea minim pe care trebuie s o ia un coeficient de corelaie
experimental pentru a putea fi considerat semnificativ, altfel spus, coeficientul de corelaie
critic este cel mai mic coeficient de corelaie semnificativ.
Semnificaia acestui coeficient critic este dependent de volumul eantionului (N) i de
numrul aa numitelor grade de libertate (n) calculat cu ajutorul relaiei: n=N-2.
Procedura de calcul utilizeaz un tabel special care cuprinde coeficienii de corelaie
critici pentru diferitele valori ale pragului de semnificaie (P) i ale gradelor de libertate (n)
(vezi Anexa nr. 2, Tabelul semnificaiei valorilor lui r)
Pentru exemplificare, presupunem urmtoarele date:
- un coeficient de corelaie r =0,88,
- un eantion pe care s-a calculat coeficientul respectiv cu N =14.
METODOLOGIA CERCETRII PEDAGOGICE


268
Rezult c numrul gradelor de libertate este n =14 - 2 =12. Pentru a estima semnificaia
coeficientului de corelaie se caut n Tabelul semnificaiei valorilor lui r pe rndul
corespunztor lui n =12 i se constat c la pragul de semnificaie cel mai riguros, respectiv
P = 0,01, corespunde r = 0,66. Coeficientul rezultat din calcul (r =0,88) este mult mai mare,
ceea ce nseamn c poate fi estimat ca puternic semnificativ.

6.2.2. Evaluarea prin tehnicile comparaiei statistice
Tehnicile comparaiei statistice se aplic atunci cnd ntre anumii indicatori statistici,
msurai pe eantioane diferite sau n etape ori n condiii diferite, apar diferene, rolul acestor
tehnici fiind acela de a estima msura n care diferenele respective sunt semnificative. Aceste
tehnici sunt utile n analiza i interpretarea datelor obinute n cadrul cercetrilor
experimentale, precum i n orice alt metodologie de cercetare care presupune analize
comparative, fie ntre datele obinute pe eantioane diferite, fie ntre datele obinute pe acelai
eantion n etape sau n condiii diferite.
Logica comparaiei statistice reflect, n fapt, logica cercetrii tiinifice i poate fi
sintetizat n dou elemente: ipoteza cercetrii i tipul eantioanelor cuprinse n cercetare.
1. Ipoteza cercetrii este elementul esenial al logicii comparaiei (de care depinde, de
altfel, i tipul eantioanelor). Ideea este c orice cercetare pornete de la o ipotez, de la o
presupunere privind existena unei anumite relaii (cauzalitate, condiionare, influenare,
asociere) ntre variaia variabilelor studiate, aa nct modificarea unei variabile este pus pe
seama aciunii sau modificrii altei variabile.
Aceste variaii mbrac forma unor diferene ntre datele ce au rezultat din msurarea
variabilelor respective (evident, dac diferenele nu exist sau nu sunt sesizate, problema
comparaiei nu se mai pune). ntrebarea este n ce msur aceste diferenele constatate sunt
rezultatul aciunii unor variabile determinate (cele presupuse prin ipotez), ori rezultatul
hazardului, al ntmplrii.
De aceea, noiunea de probabilitate i noiunea de ntmplare ocup un loc central n
tehnicile comparaiei statistice, iar valoarea acestor tehnici pentru domeniul educaional este
dat tocmai de determinismul probabilistic ce caracterizeaz micarea fenomenelor n acest
domeniu.
n baza acestui raionament, primul pas n tehnica comparaiei statistice const n
formularea unui tip special de ipotez i anume ipoteza ntmplrii, numit i ipoteza nul,
tocmai pentru faptul c ea anuleaz presupunerea existenei unei variabile factoriale, a unor
cauze sau condiii determinate, introducnd ntmplarea ca factor explicativ al variaiilor,
respectiv al diferenelor.
Astfel, admindu-se provizoriu ipoteza nul, se va determina probabilitatea ca diferenele
s fie determinate numai de legile ntmplrii, iar dac aceast probabilitate este mai mic
dect 0,05, se respinge ipoteza nul. Atenie ns, infirmarea ipotezei nule nu semnific
neaprat confirmarea ipotezei specifice a cercetrii, ci doar c exist anumii factori care
exclud sau reduc rolul ntmplrii.
De asemenea, trebuie subliniat c, chiar dac gradul de probabilitate are valori mici,
aceasta nu nseamn c se elimin complet influena ipotezei nule, valoarea indicelui de
probabilitate indicnd, gradul de risc asumat prin infirmarea ipotezei nule (la o probabilitate
de 0,05 exist totui riscul ca n 5% din cazuri rezultatul s confirme ipoteza nul).
2. Al doilea element al logicii comparaiei statistice l constituie eantioanele sau
grupurile pe care se msoar variabilele studiate. Sub acest aspect, tehnicile comparaiei
statistice se aleg i se aplic n funcie de dou tipuri de eantioane:
- eantioane independente alctuite prin tehnica eantionrii probabilistice, fr a se
stabili o relaie anume ntre elementele care compun cele dou eantioane;
Analiza statistic a datelor


269
- eantioane corelate sau asociate, selectate astfel nct fiecrui element dintr-un
eantion i corespunde un element din cellalt eantion, compoziia eantioanelor fiind
stabilit pe baza unor probe anterioare sau a unor msurri ce vizeaz variabilele
semnificative care pot aciona n sfera fenomenelor studiate, scopul unei astfel de
eantionri fiind acela de a se controla i de a se diminua influena compoziiei
grupurilor asupra diferenelor nregistrate (dup cum se cunoate, compoziia grupului
este o variabil factorial important n cercetrile educaionale).

6.2.2.1. Semnificaia diferenei dintre dou medii
n cazul eantioanelor independente
n cazul eantioanelor independente, semnificaia diferenei ntre medii se trateaz diferit,
funcie de volumul eantionului (N).
A. Dac volumul eantionului N >30, se admite, pentru nceput, ipoteza nul, respectiv
presupunerea c diferenele dintre cele dou medii sunt ntmpltoare.. Admind aceast
ipotez, nsemn c cele dou medii (m
1
i m
2
) apar normal distribuite n jurul mediei m, i au
ca dispersie:
2
2
2
1
2
1 2
N N
o o
o + =

n acest caz se aplic testul z, utiliznd formula raportului critic:
2
2
2
1
2
1
2 1
N N
m m
z
o o
+

=

Pentru a fi admis, ipoteza nul trebuie s se verifice cu o probabilitate: 0,05 < p 1.
Evident, dac p < 0,05, atunci ipoteza nul se respinge.
ntruct valorile raportului critic (z) prezint o distribuie normal, pot s apar
urmtoarele situaii:
01 , 0 58 , 2
05 , 0 96 , 1


P pentru iv semnificat m z
P pentru iv semnificat m z
= A
= A

Bineneles, dac z<1,96, ipoteza nul va fi confirmat, iar diferena dintre medii obinut
n cadrul experimentului nu va fi considerat semnificativ.
De exemplu, dac ntr-un experiment efectuat pe dou grupuri, unul experimental (G1) i
cellalt de control (G2) se obin urmtoarele date:
- pentru G1: m = 7,7, N = 33 i = 3,15;
- pentru G2: m = 6,7, N = 34 i = 3,50
atunci:
35 , 2
34
5 , 3
33
15 , 3
7 , 6 7 , 7
=
+

= z

Valoarea raportului critic, fiind cuprins ntre 1,96-2,58, i corespunde o valoare a
pragului de semnificaie (P) cuprins ntre 0,05-0,01 (prin interpolare valoarea lui P = 0,02),
prin urmare diferena mediilor este semnificativ (probabilitatea de a grei fiind doar de 2%),
ceea ce nseamn c experimentul este confirmat.
METODOLOGIA CERCETRII PEDAGOGICE


270
98 , 9
18
1977
2 10 10
6 , 97 1 , 82
2
= =
+
+
= s
B. Dac volumul eantionului N <30, ipoteza nul const n presupunerea c cele dou
eantioane reprezint grupri ntmpltoare care provin din aceeai populaie. Diferena
mediilor celor dou eantioane prezint i n acest caz o distribuie normal i are ca dispersie:
|
|
.
|

\
|
+ = +
2 1
2
2
2
1
2
1 1
N N N N
o
o o

unde:
2
= dispersia colectivitii generale
Pentru calcularea raportului critic, n scopul verificrii probabilitii ipotezei nule, se
aplic testul "t", care are la baz relaia:
|
|
.
|

\
|
+

=
2 1
2
2 1
1 1
N N
s
m m
t

unde: s
2
= estimarea dispersiei colectivitii, care se determin conform relaiei:
( ) ( )
2
2 1
2
2
2
1 2
+
+
=
N N
m x m x
s

Semnificaia valorilor raportului critic (t) se determin n funcie de numrul gradelor de
libertate (n =N
1
+N
2
- 2) folosindu-se Tabelul semnificaiei valorilor lui t, cunoscut i sub
numele de tabelul Student (tabel anex nr. 3).

Aplicaie: Pentru ilustrare, s presupunem c, pentru a determina eficacitatea unei noi tehnici
de nvare, s-a procedat la un experiment efectuat pe dou eantioane formate din 10 subieci (un
eantion experimental i un eantion de control), iar dup aplicarea testului final s-au obinut
urmtoarele rezultate:
m
1
=13,3 N
1
=10 (x - m1)
2
=82,1
m
2
=14,2 N
2
=10 (x - m2)
2
=97,6
Pe baza acestor date, se procedeaz n modul urmtor:
- e calculeaz s
2
:


- se calculeaz t:
63 , 0
10
1
10
1
98 , 9
3 , 13 2 , 14
~
|
.
|

\
|
+

= t
- se calculeaz numrul gradelor de libertate: n = N
1
+ N
2
2 = 10+10 2 = 18
- se caut n Tabelul semnificaiei valorilor lui t, la coloana n i se constat c, pentru n=18,
cea mai mic valoare a lui t (cea corespunztoare probabilitii P=0,10) este de 1,73.
ntruct valoarea lui t obinut experimental este mai mic dect aceasta, ipoteza nul se
confirm, ceea ce nseamn c diferenele dintre cele dou medii nu sunt suficient de semnificative
pentru a susine ipoteza specific a experimentului. Cu alte cuvinte, noua tehnic de nvare nu
aduce un spor semnificativ de eficacitate.




Analiza statistic a datelor


271
6.2.2.2. Semnificaia diferenei dintre dou medii
n cazul eantioanelor corelate
n cazul asocierii n perechi a elementelor celor dou eantioane, estimarea se efectueaz
asupra diferenelor care apar la fiecare pereche de date asociate. Valoarea luitse
calculeaz n acest caz ca raport ntre media diferenelor i dispersia acestor diferene,
raportate la volumul eantionului, conform relaiei:
d
N md
N
d
md
t
o
o
= =

unde: md = media diferenelor (d/N);
d = dispersia diferenelor.

Aplicaie: Pentru ilustrare, apelm la urmtoarea aplicaie: cu un grup de elevi s-a
experimentat, n semestrul al II-lea, o nou metod de nvare individual la o anumit materie,
nregistrndu-se notele elevilor la ncheierea semestrului I i la ncheierea semestrului al II-lea,
datele primare fiind grupate n tabelul nr. 6.19.
Tabelul nr. 6.19
Subieci Note sem. II Note sem. I d d2
A 8 6 +2 4
B 7 5 +2 4
C 5 5 0 0
D 6 4 +2 4
E 5 6 -1 1
F 6 4 +2 4
G 6 5 +1 1
H 5 4 +1 1
I 4 6 -2 4
J 7 5 +2 4
N = 10 = +9 = 27

Se pune problema dac metoda aplicat aduce o mbuntire semnificativ a situaiei colare
a elevilor cuprini n experiment.
Pe baza datelor din tabel, se procedeaz n modul urmtor:
- se calculeaz media diferenelor:
9 , 0
10
9
= =

=
N
d
md

- se calculeaz dispersia diferenelor:
( )
4 , 1 1 , 2
9
10
81
27
1
2
2
~ =


=
N
N
d
d
d
o

- se calculeaz raportul critic:
02 , 2
4 , 1
10 9 , 0
4 , 1
10
10
9
~ = = t

Avnd n vedere c, n acest caz, numrul gradelor de libertate este:
n = N - 1 = 10 - 1 = 9,
METODOLOGIA CERCETRII PEDAGOGICE


272
se caut n Tabelul semnificaiei valorilor lui t tabelul poziia corespunztoare lui n= 9 i se
constat c pragul de semnificaie este cuprins ntre 0,10-0,05. Prin urmare, cu o probabilitate
situat ntre 90% i 95% ipoteza experimentului se confirm, diferenele induse de noua metod de
nvare fiind semnificative, cu meniunea c, totui, au acionat i ali factori ce au influenat
rezultatele finale ale elevilor.

6.2.2.3. Semnificaia diferenei dintre frecvene.
Criteriul (testul)
2

Rezultatele unei investigaii se prezint, de multe ori, sub forma unor frecvene observate
n eantioane diferite. Pentru formularea unor concluzii privind semnificaia acestora, msura
n care ele sunt asociate sau independente, se utilizeaz testul de semnificaie, cunoscut i sub
numele de testul
2

Relaia de calcul a acestui indice, propus de K. Pearson, este:
( )


=
t
t
f
f f
2
0 2
_

unde: fo = frecvenele observate;
ft = frecvenele teoretice.
Ideea acestui test de semnificaie este aceea c, dac ntre frecvenele observate i
frecvenele teoretice nu apar diferene semnificative, atunci eantioanele asupra crora s-a
efectuat investigaia fac parte din aceeai colectivitate. Invers, dac ntre cele dou tipuri de
frecvene apar diferene semnificative, atunci variabila studiat separ colectivitatea n dou
(sau, dup caz, n mai multe) eantioane, variabila fiind un criteriu relevant pentru
structurarea ntr-un anumit mod a populaiei studiate.
Procedura de lucru este similar cu a celorlalte tehnici: se formuleaz ipoteza nul,
considerndu-se c eantioanele pe care s-au observat frecvenele sunt extrase la ntmplare
din aceeai colectivitate (ipoteza aceleiai colectiviti).

Aplicaie: Pentru ilustrarea modului de lucru, s presupunem c ntr-o investigaie concret
s-a urmrit evaluarea relaiei dintre mediul social de provenien (urban, rural) i accesul tinerilor
absolveni de liceu n nvmntul superior, frecvenele nregistrate fiind cele precizate n tabelul
nr. 6.20.
Tabelul nr. 6.20.

Mediul
urban
Mediul
rural
TOTAL (T)
Studeni a 1536 b 752 2288
Non-studeni c 662 d 498 1160
TOTAL (T) 2198 1250 3448
Se formuleaz ipoteza nul i se presupune c eantioanele pe care s-au nregistrat datele sunt
extrase la ntmplare din aceeai colectivitate, ceea ce nsemn c proporiile determinate pe
eantioane ar trebui s caracterizeze ntreaga colectivitate. Proporiile colectivitii totale nu sunt
ns cunoscute, aa nct singura soluie este aceea de a le estima pe baza datelor nregistrate pe
eantioane.
Pentru calcularea proporiilor colectivitii totale, care reprezint de fapt frecvenele teoretice,
se utilizeaz, pentru fiecare dintre cele 4 combinaii (a, b, c, d), regula de trei simpl. De pild,
pentru combinaia a, raionamentul este urmtorul: dac din numrul total al indivizilor care
compun eantionul (3448), 2288 sunt studeni, atunci la 2198 de absolveni de liceu din mediul
urban ar trebui s corespund x studeni, adic:
Analiza statistic a datelor


273
3448.................................2288
2198.......................................x
Se observ c valoarea frecvenei teoretice (ft), reprezint de fapt raportul dintre produsul
totalului liniei i coloanei respective i totalul general, adic:
general
coloan linie
t
T
T T
f

=

Se efectueaz acest calcul pentru fiecare situaie n parte, iar rezultatele se trec, n parantez,
n csua corespunztoare din tabel, respectiv:
420
3448
1450000
3448
1250 1160
740
3448
2549680
3448
2198 1160
830
3448
2860000
3448
1250 2288
1458
3448
5029024
3448
2198 2288
= =

=
= =

=
= =

=
= =

=
td
tc
tb
ta
f
f
f
f


Tabelul final va avea urmtoarea form (tabelul nr. 6.21):
Tabelul nr. 6.21.
Mediul urban Mediul rural TOTAL (T)
Studeni
a 1536
(1458)
b 752
(830)
2288
Non-studeni
c 662
(740)
d 498
(420)
1160
TOTAL (T) 2198 1250 3448
n continuare se calculeaz valoarea raportului
2
pentru fiecare situaie n parte, datele fiind
ordonate ntr-un alt tabel (tabelul nr. 3.6).
Tabelul nr. 6.22

t
f f
0

( )
2
0 t
f f

( )
t
t
f
f f
2
0


a 1536 - 1458 = 78 78
2
= 6084 6084/1458=4,174
b 752 - 830 = -78 (-78)
2
= 6084 6084/830 = 7,330
c 662 - 740 = -78 (-78)
2
= 6084 6084/740 = 8,221
d 498 - 420 = 78 78
2
= 6084 6084/420=14,485

n final se nsumeaz datele din ultima coloan i se obine valoarea indicelui:

2
= 4,172 + 7,330 + 8,221 + 14,485 = 33,208
Valoarea obinut prin calcul se raporteaz la valorile lui
2
cuprinse ntr-un tabel special
(Tabelul semnificaiei valorilor lui
2
), n care este indicat probabilitatea corespunztoare
diverselor valori, n funcie de numrul gradelor de libertate (tabelul anex nr. 4).
METODOLOGIA CERCETRII PEDAGOGICE


274
Semnificaia valorii lui
2
este dependent de numrul gradelor de libertate (n), iar acestea, la
rndul lor, sunt dependente de numrul frecvenelor luate n studiu, respectiv de numrul liniilor i
coloanelor tabelului n care au fost nscrise datele primare, relaia de calcul fiind urmtoarea:
n = (L - 1)(C - 1)
unde: L = numrul liniilor din tabel;
C = numrul coloanelor din tabel.
ntruct tabelul nr. 3.5 conine 2 linii i 2 coloane, numrul gradelor de libertate fiind de:
n = (2 - 1)(2 - 1) = 1
Apelnd la datele din Tabelul semnificaiei valorilor lui
2
, pentru n =1 i la un prag de
semnificaie de 0,01, valoarea lui
2
este mult sub valoarea obinut n investigaia concret, ceea ce
infirm destul de categoric ipoteza nul i justific afirmaia c diferenele dintre frecvenele
nregistrate nu sunt ntmpltoare, iar mediul de provenien a absolvenilor de liceu este o
variabil semnificativ pentru accesul tinerilor n nvmntul superior.

You might also like