Professional Documents
Culture Documents
CAPITOLUL 1
TEORIE ŞI EXPERIMENT ÎN PSIHOLOGIE 19
1.1 Teoria ştiinţifică 19
1.2 Finalitatea demersului ştiinţific 20
1.3 Paradigmele ştiinţei 21
1.4 Alte moduri de a face « psihologie » 22
1.5 Creativitate ştiinţifică şi hazard 25
1.6 Teorie şi experiment 25
1.7 Obiectivitatea demersului ştiinţific 27
1.8 Ştiinţă şi experiment. Specificul metodei experimentale
28
1.9 Stadialitatea cercetării ştiinţifice 30
1.9.1 Identificarea problemei de cercetat 31
1.9.2 Formularea ipotezelor 33
CAPITOLUL 2
VARIABILĂ ŞI MĂSURĂTOARE 43
2.1 Noţiunea de variabilă 43
2.2 Clasificarea variabilelor 44
2.3 Măsurarea în psihologia experimentală 46
2.4 Varietatea măsurătorilor
psihologice
47
2.5 Conţinutul operaţiilor de măsurare 49
2.6 Proprietăţile scalelor de măsurare 49
2.6.1 Scala nominală 51
2.6.2 Scala ordinală 52
2.6.3 Scala interval 53
2.6.4 Scala raport (ratio scale) 54
CAPITOLUL 3
PLANURI EXPERIMENTALE 57
3.1 Clasificarea planurilor experimentale 57
3.2 Planuri experimentale cu o singură variabilă independentă 62
3.2.1 Planuri experimentale cu grupuri independente
62
3.2.2 Planuri experimentale cu măsurători repetate 63
3.2.2.1 Avantajele planului experimental cu măsurători repetate
65
3.2.2.2 Dezavantaje 66
3.3 Planuri experimentale complexe 66
3.4 Planul bifactorial 68
3.5 Variabila parametru 70
3.6 Efecte principale (main effects) 75
3.7 Interacţiuni între variabile 80
3.8 Tipuri de interacţiuni 80
3.9 Avantajele planului factorial 85
3.10 Modele factoriale mixte 86
3.11 Planul experimental optim 88
3.12 Modelul experimental cibernetic 89
CAPITOLUL 4
CONDIŢIILE UNUI MODEL EXPERIMENTAL EFICIENT 91
4.1 Validitatea experimentului 91
4.1.1 Validitatea internă 92
4.1.2 Validitatea de construct 94
4.1.3 Validitatea externă 95
4.1.4 Validitatea statistică 96
4.1.5 Interacţiunea tipurilor de validitate 97
4.2 Surse de variaţie perturbatoare 98
4.2.1 Ameninţările validităţii interne 99
4.2.1.1 Efectele de suprapunere 100
4.2.1.2 Efectele legii dezvoltării 100
4.2.1.3 Cunoaşterea experimentală a sarcinii 100
4.2.1.4 Efectul de regresie (regression effect) 100
4.2.1.5 Erori de eşantionare 101
4.2.1.6 Diminuarea eşantionului 101
4.2.1.7 Alocarea unor grupuri preformate la condiţiile experimentale
102
4.2.1.8 Experimentatori diferiţi 103
4.2.1.9 Variabile de tip subiect 103
4.2.1.10 Variabilele sociale ale situaţiei experimentale
104
4.2.1.11 Contaminarea grupului de control 104
4.2.1.12 Egalizarea sau rivalitatea compensatorie 104
4.2.2 Ameninţările validităţii de construct 105
4.2.3 Ameninţările validităţii externe 106
4.3 Fidelitatea datelor experimentale 107
4.4 Sensibilitatea experimentului 107
4.5 Interferenţa caracteristicilor experimentului
108
CAPITOLUL 5
CONTROLUL EXPERIMENTAL 111
5.1 Înţelesurile noţiunii de control
experimental
111
5.2 Precursori ai controlului experimental 113
5.2.1 Analiza evenimentelor 114
5.2.2 Varierea circumstanţelor 114
5.2.2.1 Metoda diferenţelor 115
5.2.2.2 Metoda variaţiilor concomitente 116
5.2.2.3 Metoda acordului 116
5.3 Strategii de control experimental 117
5.3.1 Controlul în laborator 117
5.3.2 Proiectarea judicioasă a
experimentului
118
5.3.3 Măsurarea adecvată a răspunsului 119
5.3.4 Replicarea experimentului 120
5.4 Controlul în planurile experimentale cu grupuri independente
121
5.4.1 Contribuţia lui Ronald Fisher 121
5.4.2 Randomizarea 124
5.4.2.1 Randomizarea completă 125
5.4.2.2 Randomizarea în blocuri 128
5.4.2.3 Randomizarea în pătrat latin 130
5.4.3 Tabelele de randomizare 132
5.4.4 Utilizarea variabilelor moderatoare 133
5.4.5 Controlul statistic 133
5.5 Controlul în design-urile cu măsurători repetate
135
5.5.1 Balansarea completă 135
5.5.1.1 Randomizarea în blocuri în planurile experimentale cu măsurători repetate
136
5.5.1.2 Contrabalansarea 138
5.5.2 Balansarea incompletă 139
5.5.3 Controlul prin rotirea ordinii de start 140
5.5.4 Controlul efectelor transferului 140
5.5.5 Controlul efectelor de ordine şi secvenţă 142
5.6 Controlul defectuos 144
5.6.1 Experiment cu un singur grup testat la final
144
5.6.2 Experiment cu grup de control neechivalent
145
5.6.3 Experimentul expus efectelor de ordine şi de secvenţă
146
5.7 Controlul caracteristicilor sociale ale experimentului
147
5.7.1 Experimentul ca un context social 147
5.7.2 Cerinţele de rol 150
CAPITOLUL 6
DESFĂŞURAREA EXPERIMENTULUI 153
6.1 Alegerea probei de cercetat 153
6.1.1 Activarea optimă 154
6.1.2 Sesizarea faptului ştiinţific 155
6.1.3 Informare şi documentare 155
6.1.3.1 Consultarea surselor teoretice 158
6.2 Alegerea metodei şi a procedurilor 159
6.3 Definirea condiţiilor experimentale 160
6.4 Alegerea subiecţilor 161
6.5 Selecţia subiecţilor 161
6.6 Dimensionarea optimă a eşantionului 162
6.6.1 Mărimea eşantionului funcţie de puterea testului statistic
163
6.6.2 Mărimea eşantionului funcţie de mărimea efectelor
164
6.6.3 Mărimea eşantionului şi eroarea standard a mediei
166
6.7 Construirea propriului chestionar ca instrument de cercetare
167
6.8 Pretestarea 169
6.9 Valorificarea şi interpretarea datelor experimentale
169
6.9.1 Inferenţa statistică 170
6.9.1.1 Testul ipotezei de nul 171
6.9.1.2 Metoda intervalelor de încredere 176
6.9.1.3 Analiza de varianţă ANOVA 178
6.9.1.3.1 ANOVA pentru grupuri independente 178
6.9.1.3.2 ANOVA pentru desig-nuri cu măsurători repetate
183
6.9.1.4 Determinarea mărimii efectelor 186
CAPITOLUL 7
CVASIEXPERIMENTUL 189
7.1 Experiment şi cvasiexperiment 189
7.2 Specificul cvasiexperimentului 190
7.3 Tipuri de cvasiexperiment 193
7.3.1 Cvasiexperimentul cu grupuri
neechivalente
193
7.3.2 Cvasiexperimentul mixt 194
7.3.3 Plan experimental cu linia de regresie
discontinuă
195
7.3.4 Design-uri experimentale fără grupuri de control
196
CAPITOLUL 8
EXPERIMENTE CU UN SINGUR SUBIECT 199
8.1 Utilitatea experimentului cu un singur subiect
199
8.2 Avantajele experimentelor cu un singur subiect
202
8.3 Controlul în experimentele cu un singur subiect
204
8.3.1 Obţinerea unei tendinţe stabile 204
8.3.2 Întreruperea tratamentului 205
8.3.3 Modelul tratamentelor repetate 205
8.3.4 Modificarea unei variabile pentru a i se determina efectul
207
8.3.5 Determinarea mai multor tendinţe (multiple- baseline design)
207
8.3.6 Schimbarea succesivă a criteriului 208
CAPITOLUL 9
ETICA CERCETĂRII EXPERIMENTALE 209
9.1 Tratarea subiecţilor umani 209
9.1.1 Decizia de a realiza un experiment ştiinţific 212
9.1.2 Consimţământul avizat 210
9.1.3 Protejarea stării de bine a subiecţilor 211
9.1.4 Confidenţialitatea 212
9.1.5 Respectarea demnităţii 212
9.1.6 Convorbirile finale 213
9.2 Etica experimentării pe animale 214
Introducere
Definită pe larg teoria înseamnă o propoziţie sau un set de propoziţii despre relaţiile
existente între variabile. Dacă propoziţia se referă la o singură relaţie atunci este vorba de
o lege. O teorie este deci un ansamblu de legi aflate într-un anumit sistem de relaţii, a
cărui funcţie esenţială în cunoaştere este organizarea unui larg câmp de fapte într-un
sistem explicativ unitar.
Definită mai restrâns, teoria reprezintă o propoziţie sau un set de propoziţii despre
relaţiile dintre variabile care includ cel puţin un concept care nu este direct observat dar
care este necesar explicării relaţiilor dintre variabile (McBurney, op. cit.). Conceptele de
tipul memorie de scurtă durată, de lungă durată, etc. nu sunt prezente nici în propoziţiile
care descriu fapte particulare nici în enunţurile legilor. Ele au caracter teoretic pentru că
nu pot fi observate sau măsurate direct dar pot fi inferate indirect din alte date de
observaţie şi sunt necesare explicării relaţiilor dintre variabile. Conceptele teoretice sunt
invenţii ale oamenilor de ştiinţă pentru a explica legile comportamentului (exemplu:
conceptele de filtru, superego, arhetip, etc).
Raţiunea de a fi a teoriei ştiinţifice rezidă în funcţiile sale de bază care sunt:
a) Realitatea lumii. Poziţia filosofică omonimă este Realismul (obiectele percepute există
indepedent de noi). Pentru omul de ştiinţă lumea este reală şi trebuie studiată cât mai bine
cu putinţă. Realismul omului de ştiinţă se deosebeşte totuşi de acela al omului de rând
(realism naiv) care crede că lumea este exact aşa cum o vede deoarece lumea omului de
ştiinţă este o lume recreată conceptual, adică văzută prin prisma noţiunilor ştiinţifice.
c) Regularitatea. Lumea poate fi cunoscută graţie unei anumite ordini care guvernează
manifestările ei. Ordinea înseamnă consistenţă şi regularitate. Ideea de regularitate a
lumii corespunde convingerii că fenomenele există în forma unor modele care se reiau
neîncetat conform unor legi universale. Orice s-ar întâmpla în viitor poate fi subsumat
anumitor legi ale ştiinţei. Psihologia ca ştiinţă presupune că nimic legat de
comportamentul uman nu cade în afara legilor naturii indiferent unde şi când ar avea loc
acest comportament.
Cursul ştiinţei nu este linear ci brăzdat de crize care urmează unor perioade de relativă
linişte, numite de Th. Kuhn („Structura revoluţiilor ştiinţifice”) ştiinţa normală. Pe durata
acestor faze de linişte comunitatea ştiinţifică aderă la anumite paradigme. Prin paradigmă
înţelegem totalitatea legilor, teoriilor, metodelor şi aplicaţiilor care constituie o tradiţie
ştiinţifică (De exemplu paradigma condiţionării clasice a lui Pavlov). În perioadele de
criză apar noi fapte ştiinţifice care nu sunt explicate satisfăcător în limitele vechii
paradigme. Apare o nouă paradigmă care va fi acceptată dacă explică mai bine datele
empirice.
În 1977 Larry Laudan („Progress and its problems: towards a theory of scientific
growth”) prezintă ştiinţa ca pe un proces de rezolvare de probleme. Dacă pentru Kuhn o
teorie era mai bună decât alta şi îi lua locul doar dacă reuşea să explice un volum mai
mare de date empirice, pentru Laudan această înlocuire se produce dacă noua teorie poate
rezolva mai multe probleme decât teoria precedentă. Laudan consideră că raţiunea
teoriilor ştiinţifice este aceea de a rezolva probleme empirice şi conceptuale.
Preferinţa oamenilor de ştiinţă pentru o teorie sau alta are şi o motivaţie iraţională, dar
atunci când o teorie este preferată pentru aspectele conceptuale atunci comportamentul
lor este considerat raţional.
Kneller (1978) distinge două mari faze ale cercetării ştiinţifice:
Ciclul descoperirii şi ciclul validării. Primul include eforturile, uneori solitare alteori în
echipă, de a efectua observaţii, de a emite ipoteze care sunt riguros testate. În a doua fază,
în urma comunicării rezultatelor, acestea sunt verificate de către comunitatea ştiinţifică.
Alţi cercetători repetă experimentul şi dacă sunt obţinute rezultate similare, cercetarea
este validată. Ştiinţa se bazează numai pe fapte reproductibile, adică replicate în alte
cercetări, desfăşurate cu aceleaşi metode şi în aceleaşi condiţii dar în locuri diferite şi cu
alţi subiecţi. Următorul exemplu, comentat de A. Dragu (2003), este elocvent pentru
succesiunea celor două cicluri: Efectul Ringelman, fenomen pus în evidenţă de inginerul
francez cu acelaşi nume, a suscitat un interes deosebit din partea comunităţii ştinţifice.
Experimentul efectuat de Ringelman, ale cărui date arătau o descreştere dramatică a
efortului fizic individual pe măsură ce numărul participanţilor la experiment creştea de la
unu la opt persoane, a fost replicat de Ingham şi colaboratorii săi, în 1974, apoi de un alt
colectiv de cercetători, condus de Latane, în 1979 şi 1988. De asemenea, Weldon şi
Garagano în 1988 precum şi Williams, Nida, Baca& Latane, în 1989 s-au ocupat de acest
fenomen. Replicările au confirmat, unele parţial, altele în cea mai mare parte, rezultatele
lui Ringelman, dar au contribuit totodată la adâncirea cauzelor care generează acest efect.
Ringelman pusese acest efect pe seama lipsei de coordonare a efortului în grup. Ingham
şi colaboratorii au demonstrat rolul lipsei de motivaţie în generarea efectului de irosire
socială, iar Latane a dovedit că fenomenul este generat de acţiunea simultană a lipsei de
coordonare a efortului şi de diminuarea motivaţiei. Studiile mai recente atribuie acest
efect fenomenului de irosire socială adică difuziei responsabilităţii indivizilor la nivelul
grupului. Sentimentul anonimatului este acela care diminuează motivaţia şi diluează
responsabilitatea participanţilor
Cercetarea ştiinţifică parcurge următorii paşi:
1) Identificarea şi definirea problemei de cercetat;
2) Formularea ipotezelor;
3) Testarea ipotezelor; derularea cercetării;
4) Elaborarea concluziilor.
Trebuie precizat că aceste etape nu sunt rigide, de la o cercetare la alta această schemă
putând căpăta concretizari mai mult sau mai puţin diferite. Să le trecem succint în revistă.
1.9.1 Identificarea problemei de cercetat
Nu este deloc, aşa cum s-ar putea presupune, o etapă facilă cu atât mai mult cu cât:
a) Nu orice poate fi experimentat. Sunt probleme pe care stadiul actual al ştiinţei, sau
considerente de ordin etic fac imposibilă abordarea lor pe cale experimentală. De
exemplu multe dintre conceptele psihanalizei nu pot fi abordate experimental. De
asemenea, manipularea unor variabile psihofiziologice sau de personalitate poate afecta
grav echilibrul persoanei. Dar cele mai grave limitări provin din experimentatorul însuşi,
din capacitatea lui de a sesiza faptul ştiinţific.
b) Sesizarea unui fapt demn de cercetat care prezintă interes şi valoare ştiinţifică se
produce pe fondul unor cunoştinţe teoretice solide, bine structurate care ajută cercetătorul
să sesizeze problema acolo unde simţul comun o trece neobsevată.
Ca orice ştiinţă psihologia operează cu fapte ştiinţifice. După Cl. Bernard un fapt capătă
valoare ştiinţifică doar în măsura ataşării sale unei idei.
Piaget (op.cit.) distinge următoarele caracteristici ale faptului ştiinţific:
Faptele ştiinţifice în psihologie sunt fapte psihice sau de conduită şi se referă fie la
comportamentul extern fie la conţinutul psihologic intern.
Observarea faptelor este indispensabilă în tot cursul experimentării. Observaţia nu
reprezintă o simplă lectură a faptului brut ci se prelungeşte într-un act de clasificare, de
încadrare a informaţiei în anumite concepte şi de anticipare a unor relaţii (Al. Roşca,
1971). Aceasta echivalează cu sesizarea faptului ştiinţific. Ca instrumente de observaţie
sunt utilizate grilele de observaţie care reprezintă un cadru de clasificare format din
categorii. Acestea trebuie să nu fie mai numeroase de 10, să fie disjuncte şi să epuizeze
aspectele principale ale fenomenului observat (Radu, I, 1993)
De obicei cercetarea unei probleme noi se axează pe strângerea de date de observaţie şi
mai puţin pe testarea unei teorii ştiinţifice. Totuşi trebuie să recunoaştem că şi cele mai
elementare observaţii nu pot fi efectuate în afara unor cunoştinţe care provin dintr-o
teorie sau din teorii anterioare. Există două modalităţi de cunoaştere ştiinţifică:
Vadum şi Rankin (op. cit.) împărtăşesc convingerea că multe dintre ipoteze sunt
rezultatul unor ghiciri privind modul în care relaţionează evenimentele care ne
interesează.
Hempel susţine în a sa „Philosophy of Natural Science” că teoriile generale şi ştiinţa în
speţă nu rezultă pur şi simplu din faptele observabile. Procesul care duce la insiht, la
degajarea principiului cu valoare explicativă este încă încărcat de mister. Norocul de a da
peste fapte relevante (happy guess) trebuie susţinut de un travaliu teoretic pe măsură
(preparated mind). Cu alte cuvinte, norocul în munca ştiinţifică apare de obicei după o
lungă perioadă de activitate intensă.
Thomas Kuhn (1970) susţine că ideile revoluţionare într-o ştiinţă vin cel mai adesea de la
oameni noi în domeniu sau de la tineri, a căror pregătire de bază le permite să vadă
lucrurile într-o manieră inovatoare. Succesul „noilor veniţi” în ştiinţă (în psihologie,
exemplele abundă: Pavlov, Freud, Jung, Kelley, Murray, Spearman) vine de la faptul că
nefiind câtuşi de puţin prizonierii unei anumite tradiţii sau poziţii teoretice, ei îi sesizează
cu mai mare uşurinţă fisurile şi sunt mult mai tentaţi să o inoveze.
O ipoteză este o propoziţie despre care se spune că este adevărată cu scopul de a i se testa
validitatea. Are următoarele note definitorii:
-Poate fi pusă sub forma dacă-atunci;
-Este adevărată sau falsă;
-Poate fi testată empiric.
Ipoteza reprezintă un răspuns anticipat pe care cercetătorul îl dă problemei puse. El
realizează, astfel, un contur coerent al unui model sau al unei teorii ştiinţifice care
urmează a fi verificată odată cu ipoteza enunţată. Sursele ipotezelor sunt variate. Una
dintre ele este de natură inductivă şi constă în observarea unui fapt inedit în cursul unui
experiment. Deşi se naşte din observarea faptelor, ipoteza se reformulează în termenii
proprii stadiului atins de ştiinţă. Un exemplu va fi edificator: Piaget emite ipoteza
obiectului permanent pe baza observării comportamentului unui copil de 13 luni care are
tendinţa de a căuta o minge în locul unde altădată a reuşit să o recupereze şi nu din locul
unde mai recent nu reuşise să o găsească.
Ipotezele sunt, în alte cazuri, deduse dintr-o serie de legi sau regularităţi deja stabilite
între anumite fenomene. Aceasta presupune cunoaşterea în profunzime a literaturii
consacrată problemei studiate. Un fond larg de cunoştinţe echivalează cu un fond larg de
ipoteze latente (Al. Roşca, 1971). Paul Fraisse (1970) ilustrează calea deductivă enunţând
două legi privitoare la recunoaşterea unui cuvânt:
pragul de recunoaştere a unui cuvânt (timpul minim de expunere necesar) este cu atât mai
mic cu cât frecvenţa cuvântului în limbă este mai mare;
pragul de recunoaştere pentru orice stimul este mai scurt dacă subiectul are o atitudine
perceptivă adecvată (informaţii asupra naturii stimulului).
Din cele două legi s-a dedus următoarea ipoteză: pragul de recunoaştere a cuvintelor de
frecvenţă egală este mai mic dacă subiectul are elaborată o atitudine preperceptivă
adecvată.
Etapa formulării ipotezei este faza cea mai creativă a experimentului. Confruntat cu o
serie de fapte şi cunoştinţe cercetătorul presupune existenţa unei relaţii pe care căută să o
verifice.
Aşa cum am mai spus, una dintre condiţiile esenţiale îndeplinite de ipotezele ştiinţifice
este aceea de a fi testabile. Potrivit lui Hempel (1966) ipoteza este orice aserţiune
testabilă neavând importanţă dacă scopul ei este să explice un anumit fapt sau să exprime
o lege generală sau o propoziţie mult mai complexă .
Odată emisă ipoteza va conduce la anumite implicaţii, adică la predicţii privind ce anume
va fi observat într-o anumită situaţie particulară. Ipotezele sunt implicaţii test de tipul
„dacă… atunci” bazate pe presupunerea că aserţiunea este adevărată. Mai precis ele
prevăd că dacă sunt îndeplinite anumite condiţii vor avea loc anumite evenimente. Calea
pe care sunt obţinute implicaţiile testabile ale unei ipoteze este calea deductivă.
Specific metodei deductive este opunerea a două teorii care oferă pentru acelaşi fenomen
explicaţii opuse, extragerea unor predicţii şi testarea acestora pentru eliminarea uneia
dintre teorii. Experimentul care testează cele două teorii se numeşte experiment crucial,
dat fiind faptul că inevitabil una va fi respinsă (Roşca Al., op. cit.)
Verificarea ipotezei constituie faza travaliului experimental. Dacă primele două etape pot
fi întâlnite şi în activitatea scriitorului sau filosofului ultima este puternic specifică
cercetătorului care trebuie să demonstreze temeinicia ipotezei reproducând în condiţii de
laborator relaţia dintre faptele observate (Roşca Al., op. cit.).
Etapa testării ipotezelor implică ea însăşi o serie de paşi pregătitori cum sunt stabilirea
tipului de subiecţi care urmează să participe la experiment, elaborarea planului cercetării,
asigurarea suportului tehnic şi metodologic, respectiv alegerea aparaturii, a procedeelor
de lucru şi a tipului de măsurători care vor fi efectuate privitor la variabila dependentă.
Măsurarea unor concepte este posibilă dacă acestea sunt redefinite adică operaţionalizate
în termeni care se pretează acestei măsurări.
Conţinutul principal al acestei etape este derularea experimentului însuşi adică
manipularea variabilei independente simultan cu asigurarea controlului celorlalte surse de
variaţie şi efectuarea observaţiilor planificate. Expresia „observaţii” este utilizată în
sensul generic de date obţinute din cercetare, nu obligatoriu din observaţie ca metodă de
cercetare.
Primele stadii ale psihologiei au fost motivate de curiozitatea faţă de lumea care există în
fiecare dintre noi. Ulterior datele experimentale au furnizat ele însele noi întrebări încât
un alt tip de motivaţie decât simpla curiozitate stă la baza dezvoltării ştiinţei: nevoia de a
acorda teoriile la noile date. Totuşi curiozitatea motivează şi astăzi unele dintre cele mai
sofisticate cercetări.
O altă motivaţie care stă la baza progresului în ştiinţă este nevoia rezolvării unor
probleme practice. Multe dintre teoriile cele mai moderne s-au dezvoltat din cercetări
aplicate. Aşa este cazul teoriei detecţiei semnalelor a cărei raţiune este aceea de a explica
modul cum operatorul de radar reuşeşte să detecteze semnalele rare cum sunt ţintele
inamice.
Există şi domenii practice-aplicative ale psihologiei ştiinţifice care nu se interesează de
teorie fiind focalizate pe probleme practice, aşa cum sunt de exemplu evaluarea
metodelor de predare sau a eficacităţii unei campanii publicitare. Totuşi, în aceste
domenii pot apărea date neconcordante care stimulează apariţia unor teorii care să
restabilească unitatea ştiinţei.
Edwin P. Willems (1969) propune o clasificare unde operează două criterii şi anume:
Există experimente în care cercetătorul are o redusă liberate în a alege unităţile variabilei
dependente. Astfel, în experimentele pe animale, repertoriul comportamental se reduce de
cele mai multe ori la prezenţa sau absenţa reacţiei. Mai mult, există o anumită
specificitate a răspunsului la stimuli proprie fiecărei specii. Iată, de pildă, la acelaşi
stimul, hrana, şobolanii reacţionează eficient prin miros, pe când păsările utilizează
preponderent informaţiile vizuale. (Garcia şi Koelling, 1966). Cu alte cuvinte, vrem să
subliniem faptul, că în astfel de situaţii, când alege modalităţile de reacţie ale subiecţilor,
experimentatorul trebuie să se conformeze limitelor biologice ale speciei. Dimpotrivă, în
experimentele pe subiecţi umani cercetătorul are o mai mare liberate în a alege acel tip de
răspuns care să exprime optim efectele manipulării experimentale. În astfel de cercetări
omul de ştiinţă restricţionează largul repertoriu comportamental al subiecţilor la câteva
categorii. De exemplu dintre multiplele aspecte ale reacţiei verbale, cercetătorul se poate
focaliza doar pe numărul de verbe şi adverbe.
Cercetările pot fi astfel clasificate în joase, medii şi înalte privitor la impunerea de către
cercetător a unor unităţi asupra răspunsurilor subiecţilor. La fel, ele pot fi împărţite în alte
trei nivele după prima dimensiune, gradul de control la dispoziţia cercetătorului.
1.12 Perpetua nevoie de ştiinţă
Istoria civilizaţiei este in mod esenţial istoria progresului neîntrerupt al spiritului uman.
Lungul ei drum până la stadiul ştiinţei zilelor noastre pare să fi sădit în natura umană o
nevoie constitutivă de ştiinţă, ca o cale de cunoaştere autentică. Totuşi a face ştiinţă se
deosebeşte de consumul de ştiinţă implicând cel puţin tot atâta pasiune şi dăruire câtă
implică arta, sau celelalte forme ale activităţii umane (Vadum şi Rankin, 1998).
Mobilurile care îi determină pe unii oameni să-şi dedice viaţa cercetării ştiinţifice sunt
variate. Pentru unii este presantă nevoia de a găsi răspuns la problemele perene pe care
omenirea şi le-a pus de la începuturile sale îndepărtate privitoare la sensul vieţii şi la
rostul omului în lume, pentru alţii nevoia de a da un înalt sens propriei existenţe sau de a
găsi răspuns la o serie de probleme acute în domeniul ştiinţei de care sunt interesaţi.
Henri Poincaré vorbea despre aşa zisa frumuseţe intelectuală pe care omul de ştiinţă o
desluşeşte în armonia naturii şi care motivează eforturile îndelungate, în ciuda
nenumăratelor piedici, în domeniul cercetării ştiinţifice.
Progresul unei ştiinţe, iar psihologia nu face excepţie de la regulă, îngemănează două
procese aparent opuse şi anume diversificarea, evoluţia în extensiune pe de o parte şi
specializarea, adâncirea cunoaşterii unor domenii restrânse care echivalează cu
dezvoltarea în intensiune. Interesele, preferinţele oamenilor de ştiinţă ocupă un loc
important în cauzalitatea multiplă a acestei evoluţii, cu atât mai mult cu cât ele se
exprimă în paradigmele unui anumit stadiu de dezvoltare al ştiinţei respective. Cu alte
cuvinte dacă vrem să ştim încotro se îndreaptă psihologia secolului al XX-lea ar fi util să
întrevedem care sunt temele majore ale cercetării care polarizează interesul comunităţii
psihologilor. Un astfel de studiu a fost întreprins de A.P.A în 1952. Este vorba de un
program care a cuprins două proiecte: Primul, a evaluat gradul de dezvoltarea al ştiinţei
psihologiei la acea vreme. În acest scop Sigmund Koch, conducătorul acestui proiect, a
solicitat celor mai reprezentativi psihologi americani să scrie câte un capitol despre
domeniul lor. Aceste capitole au generat şase volume care conţin un sumum al
cunoştinţelor de psihologie la momentul respectiv.
Al doilea proiect a fost condus de către Kenneth E. Clark de la Univ. Minnesota.
Proiectul a fost de natură empirică şi a urmărit să contureze mai clar cunoştinţele despre
profesiunea de psiholog. Subiecţii pe care s-a efectuat cercetarea au fost membrii APA de
pe tot cuprinsul ţării. În staff-ul central al APA care a condus cercetarea a fost cooptat şi
R. Thorndike. El a avut ideea de a realiza triade de câte trei psihologi din istoria
psihologiei ale căror contribuţii remarcabile erau egale dar diferite din punctul de vedere
al domeniilor asupra cărora s-au aplecat. Un chestionar conţinând astfel de triade a fost
expediat la 200 de psihologi americani cerându-li-se să ierarhizeze personalităţile din
fiecare triadă în ordinea importanţei contribuţiei lor. Ipoteza lui Thorndike era că
preferinţele psihologilor evaluatori vor exprima de fapt interesele lor faţă de ariile
psihologiei. În adevăr, pe baza rezultatelor, care au confirmat că evaluările psihologilor
au fost influenţate de domeniul psihologiei în care erau implicaţi (cercetare, psihologia
muncii, clinică, etc.), preşedintele APA de la acea vreme Lee J. Crombach a conchis că
există două curente privind metodologia, gândirea şi preferinţele în psihologia sec. XX.
Cronbach a vorbit într-un studiu de existenţa a două direcţii în cercetarea psihologică
contemporană şi anume una, experimentală, alta de natură corelaţională. Psihologii
experimentalişti menţin pe cât posibil constante diferenţele între indivizi şi variază
condiţiile experimentale. Psihologii corelaţionişti, dimpotrivă, vor să ţină constante
condiţiile pentru a face cât mai pregnante diferenţele dintre subiecţii cercetării.
Ulterior, Gordon Allport (1992) analizând dezvoltarea teoriilor personalităţii a prefigurat
două mari direcţii cărora li se subsumează cercetările din acest domeniu, orientările
nomotetică şi ideografică. Vom vedea într-un capitol viitor, că sub aspectul planurilor
experimentale, orientarea nomotetică implică experimentarea cu grupuri de subiecţi, pe
când direcţia ideografică cuprinde experimente efectuate cu un singur subiect.
Variabilele care intervin într-un experiment pot fi clasificate pe baza mai multor criterii:
a) Funcţie de rolul de cauză sau de efect jucat în experiment: variabilă dependentă –
variabilă independentă.
Variabilă dependentă. Întruneşte următoarele caracteristici:
- Este o măsură a comportamentului subiectului care reflectă efectele variabilei
independente.
- Este o variabilă suspectată a fi consecinţa unei variabile independente (Vadum şi
Rankin 1998).
Variabila independentă este condiţia manipulată sau selectată de experimentator pentru a
determina efectele sale asupra comportamentului. Numim efect orice modificare
observabilă, cantitativă sau calitativă, produsă în variabila dependentă.
Variabila independentă este definită de Vadum şi Rankin (1998) drept o variabilă pe baza
căreia are lor crearea sau selectarea condiţiilor antecedente într-un studiu.
Trebuie efectuată distincţia între relaţia, ca spunem aşa, naturală existentă între cauză şi
efect şi relaţia de laborator dintre echivalentele lor, adică dintre variabila independentă şi
variabila dependentă. În laborator singura posibilitate de a evidenţia efectele cauzei este
de a produce varierea cantitativă sau calitativă a variabilei independente. Cu alte cuvinte,
cauza devine activă producând efectele anunţate de ipoteză, doar dacă este variată
cantitativ, calitativ, sau prin prezenţă-absenţă.
Sunt experimente în care este greu de precizat care variabilă este independentă şi care
este dependentă. În aceste studii scopul principal este tocmai identificarea variabilei
independente. Este cazul acelor studii care s-ar interesa de relaţia existentă între
vizionarea de către copii a filmelor violente şi creşterea agresivităţii lor sau de relaţia
dintre stres şi oboseală.
b) Funcţie de caracteristicile domeniului de definiţie: variabile continue – variabile
discrete
- Variabila continuă se situează pe un continuum şi nu este limitată la un anumit număr
de valori. Latenţa, forţa, durata pot lua prin măsurare orice valoare.
- Variabila discontinuă, dimpotrivă, ia valori discrete care cad în categorii distincte
separate. Exemple de variabile discontinue sunt sexul, tipurile psihologice etc. De
asemenea, culorile, din punct de vedere psihologic sunt categorii discrete, dar
echivalentele lor fizice, adică lungimile de undă a radiaţiei luminoase reflectate, aparţin
unui continuu de la 396 la 760 milimicroni.
c) Variabile cantitative şi variabile calitative
Variabilă cantitativă.
Variabila cantitativă variază în mărime (ex: viteza de răspuns, intensitatea etc). Valorile
ei se situează pe un continuum şi semnifică gradul sau mărimea dimensiunii măsurate.
Variabilă calitativă – variază în privinţa tipului, felului (ex: înclinare sau întoarcere la
stânga sau la dreapta într-un labirint). Multe variabile considerate în mod comun a fi
calitative şi discrete se dovedesc a fi cantitative şi continui: intro-extraversia, normal-
neurotic, masculinitate-feminitate, scorurile la foaia de autoanaliză a lui Cattell, etc.
Criteriile de clasificare a variabilelor nu se exclud reciproc ci dimpotrivă se regăsesc în
aceeaşi variabilă. Astfel o variabilă independentă cum este tipul temperamental poate fi
discontinuă, calitativă şi invocată.
De asemenea, unele variabilele independente sunt exprimate cantitativ altele calitativ. O
variabilă independentă, cantitativă este, spre exemplu, intensitatea unui stimul sonor la
auzul căruia subiectul trebuie să apese pe o pedală. Putem alege diverse valori de 10,
20….60Hz. Un exemplu de variabilă independentă calitativă îl constituie un stimul vizual
colorat în roşu, verde, galben şi albastru. Cele patru culori sunt numite modalităţi sau
condiţii.
d) Variabile fizice şi nonfizice
Variabilă fizică - aspect al variabilei (independente sau dependente) care poate fi
exprimat ca mărime fizică (exemple: intensitatea luminii stimul, amplitudinea undelor
cerebrale, etc).
Variabilă nonfizică – aspect al condiţiilor de testare care este exprimat în termeni
comportamentali sau procese cognitive (exemple: privare – nonprivare de somn,
familiarizarea – nonfamiliarizarea cu situaţia de testare, etc).
Un tip aparte de variabilă nonfizică este variabila subiect care se bazează pe diferenţele
individuale ale subiecţilor incluşi în experiment, ca de exemplu, introversiunea-
extraversiunea, ciclotimia-schizotimia, masculinitatea-feminitatea, etc. Iată două exemple
care ilustrează modul în care variabila subiect poate fi luată ca variabilă independentă sau
ca variabilă dependentă:
1) Ipoteza verificată într-un experiment este că tipurile temperamentale sunt caracterizate
prin viteze de răspuns diferite. Variabila independentă, de tip subiect are două modalităţi,
introversiunea şi extroversiunea. Se compară performanţele medii la un test de
reactivitate pentru cele două grupuri independente, introvertiţii şi extravertiţii.
2) În al doilea experiment ipoteza verificată este aceea că dimensinea extro-introversie va
înclina spre un pol sau spre altul, funcţie de experienţa anterioară. Variabila subiect este
tema povestioarei audiate înainte de măsurarea intro-extraversiunii cu un chestionar
potrivit. Un grup de subiecţi audia o povestire tristă, iar celălalt asculta o poveste care
degaja optimism.
e) Gradul de intervenţie al experimentatorului în manipularea variabilei: variabilă
manipulată – variabilă invocată sau naturală.
Variabila invocată este variabila independentă proprie cvasiexperimentelor (vezi mai pe
larg § 9.2). Variabilele invocate sunt de obicei variabile subiect sau variabile demografice
(vârstă, sex, nivel de şcolarizare, etc).
Există situaţii când în acelaşi experiment o variabilă propriu zisă coexistă cu o variabilă
invocată.
f) După tipul de plan experimental care le utilizează: variabile intrasubiect-variabile
intersubiect (vezi şi 3.2).
Variabile intrasubiect sunt variabile independente ale căror valori sau condiţii sunt
parcurse de către toţi subiecţii incluşi în experiment. Decelarea efectelor produse la
nivelul comportamentului de către manipularea variabilei independente este posibilă prin
compararea subiectului cu el însuşi.
Sunt utilizare în experimentele cu măsurători repetate numite, în literatura anglo-saxonă
„within subjects experiments.”
Variabilele intersubiect sunt variabile independente ale căror valori sau modalităţi sunt
parcurse de grupuri diferite de subiecţi. Ele sunt prezente în modelele experimentale cu
grupuri independente („independent groups plans” sau between-subjects plans).
Se consideră că un indicator al progresului într-o ştiinţă este măsura în care legile sale
sunt formulate cantitativ. Faptul că legile pot fi formulate cantitativ indică două lucruri:
Fenomenul este destul de constant pentru a permite un enunţ destul de• exact despre el.
Dimpotrivă datele care variază ascund regularităţile cu aspect de lege.
Legea este destul de simplă pentru a permite o exprimare numerică.•
Legile psihofizice se pretează mai bine unei astfel de exprimări cantitative, pe când legile
motivaţiei sau ale cogniţiei suportă mai de grabă o formulare calitativă, dat fiind
specificul acestor paliere înalte ale vieţii psihice.
Măsurarea variabilelor studiate constituie o trăsătură proeminentă a psihologiei moderne
(L. E. Tyler, W. Bruce Walsh, 1979) şi multe dintre progresele ei sunt legate de evoluţia
psihometriei. Astfel, pretenţiile că acuitatea senzorială este un semn al inteligenţei, că
tipul de personalitate al mamei care respinge copilul ar fi cauza autismului acestuia, sau
că loboctomia prefrontală ar vindeca unele boli psihice sunt exemple de aserţiuni care au
fost respinse odată cu introducerea în domeniile respective a unor tehnici de măsurare
precise (Vadum şi Rankin, op. cit).
În general rezultatele unei cercetări sunt influenţate în mod considerabil de instrumentele
cu care sunt măsurate variabilele incluse în modelul experimental.
De aceea în faza de proiectare a experimentului cercetătorii acordă o mare importanţă
strategiilor de măsurare care vor fi utilizate în cercetare.
Inventarierea unor astfel de situaţii l-au condus pe Stevens, S., S. (1946) la ideea
existenţei unei ierarhii (sistem) a tipurilor de măsurătoare dupã criteriul aplicabilităţii
celor patru operaţii fundamentale. Aşa cum remarcã L. Tyler şi B. Walsh (op. cit.) fiecare
nivel al sistemului are regulile şi restricţiile lui proprii şi permite aplicarea doar a unor
anumite procedee statistice. Altfel spus, ficare tip de scală de măsurare este definit printr-
un anumit set de proprietăţi, dintr-un total de patru, in virtutea cărorara obiectelor sau
fenomenelor le sunt ataşate numere (D. McBurney, 1983). Aceste proprietăţi sunt:
egalitatea, ordinea de rang, egalitatea intervalelor şi egalitatea raporturilor sau câturilor.
La acestea o vom adăuga pe a cincea, la care numeroşi autori se referă (Tyler şi Walsch
1979, McBurney, 1983, Vadum şi Rankin, 1998) prezenţa reperului 0 cu sens.
Să le trecem succint în revistă după Vadum şi Rankin (1998) în ordinea generalităţii lor :
Proprietatea egalităţii este confirmată dacă doi subiecţi care ocupă acelaşi loc pe scală
sunt egali din punctul de vedere al însuşirii măsurate.
Proprietatea ordinii de rang există dacă cele mai mari scoruri de pe scală aparţin
persoanelor care deţin însuşirea măsurată în cel mai înalt grad.
O scală are proprietatea intervalelor egale dacă distanţele egale între scoruri pe toată
lungimea scalei echivalează cu diferenţe egale în însuşirea măsurată. Scala coeficienţilor
de inteligenţă cu media 100 şi abaterea standard egală cu 15 nu are această proprietate
întrucât diferenţa între QI-urile 78-80 nu este egală cu diferenţa 110-112, deoarece primul
interval aparţine subiecţilor cu o inteligenţă situată în media inferioară, pe când a doua
diferenţă se situează în media superioară.
Proprietatea rapoartelor egale se referă la faptul că rezultatul împărţirii unui scor de pe
scală cu un altul poate fi utilizat în compararea cu sens a celor două scoruri. Astfel, dacă
efectuăm câtul dintre înălţimea subiectului A de 180cm şi a lui B de 150cm obţinem
180:150=1.2 Putem afirma că subiectul A este mai înalt de 1,2 ori decât subiectul B. Nu
acelaşi lucru este posibil cu doi coeficienţi de inteligenţă. În psihologie este lipsit de sens
un raport efectuat între doi coeficienţi de inteligenţă.
Să presupunem că am administrat un chestionar de anxietate la mai mulţi subiecţi,
scorurile minim şi maxim posibile fiind 0 şi respectiv, 20. Dacă un subiect A obţine un
scor de 10 iar altul B de 20, nu avem nici un temei să spunem că subiectul B este două ori
mai anxios decât subiectul A. O astfel de comparaţie este posibilă numai dacă
transformăm aceste scoruri în note standard.
O a cincea proprietate este existenţa unei semnificaţii psihologice pentru valoarea 0 de pe
scală. Stevens a realizat o scală a zgomotului unde reperul 0 are sens, anume că în spaţii
izolate fonic sursele de zgomot sunt eliminate. În general în experimentele din domeniul
senzaţiilor reperul 0 de pe scală semnifică lipsa senzaţiei datorită situării intensităţii
stimulului cu mult sub pragul senzorial absolut.
În sistemul de măsurare propus de Stevens între cele patru proprietăţi există o relaţie de
subsidiere în sensul că ultima, proprietatea rapoartelor egale le înglobează automat pe
celelalte trei, a treia pe celelalte două şi a doua pe prima. Deci o scală care are
proprietatea intervalelor egale va avea obligatoriu şi proprietăţile ordinii de rang şi a
egalităţii. Proprietatea unui reper zero semnificativ, pare să fie totuşi proprietatea cea mai
generală, pe care nu o au decât scalele raport.
2.6.1 Scala nominală
Scara nominală are doar proprietatea egalităţii. În acesată scală evenimentele sau
obiectele de acelaşi tip vor primi aceleaşi numere, iar obiectele şi evenimentele diferite
vor primi numere diferite. Aici numerele sunt utilizate doar pentru a identifica anumite
categorii în care indivizii pot fi împărţiţi. Aşa se întâmplă cu numerele înscrise pe
tricourile jucătorilor sau când codificăm sexul masculin cu cifra 1 iar pe cel feminin cu
cifra 2. În aceste cazuri operaţiile aritmetice fundamentale sunt inaplicabile. De asemenea
nu sunt permise procedurile statistice deoarece scorurile de pe această scală ca şi cele de
pe scala ordinală nu au distribuţii normale (Vadum şi Ranchin, 1998). Totuşi în ultimii
ani unii autori au dezvoltat tehnici statistice speciale care se pretează acestui tip de scală
(Vezi, I. Radu, 1993, p. 285) .
Scala nominală este utilizată în procesul clasificării care este începutul oricărei ştiinţe (D.
McBurney, 1983). Exemplu, privind tipurile de personalitate din clasificarea lui Eysenck:
1. Introvert
2. Extrovert
3. Nevrotism
4. Psihoticism
Are două proprietăţi, egalitatea şi ordinea de rang. Acest tip de măsurătoare este utilizat
la ordonarea subiecţilor în sens crescător sau descrescător privind o anumită caracteristică
psihică, fără să cunoaştem cu exactitate distanţa dintre cei doi membrii ai fiecărei perechi.
A nu fi confundat cu metoda rangurilor care, dimpotrivă ia în seamă această distanţă.
Regula după care funcţionează această scală este că numerele care indică rangurile pe
scală echivalează cu ordinea de merit a aributelor psihologice evaluate.
Metoda percentilelor despre care vom vorbi ceva mai departe se încadrează în acest tip de
măsurătoare.
Nici în cazul acestui tip de măsurătoare nu pot fi aplicate operaţiile aritmetice elementare.
Iată un exemplu : Unui elev i s-a cerut să ordoneze pe criteriul intensităţii preferinţei
cinci dintre disciplinele studiate. El a dat următorul răspuns :
5. Mate
4. Fizică
3. Informatică
2. Geografie
1. Sport
Unele dintre scările de aprecire, şi în general acelea care măsoară preferinţele oamenilor
constituie exemple de scări ordinale.
7. Mate
6. Fizica
5.
4. Informatică
3.
2. Geografie
1. Sport
Scala raport (ratio scale) are toate cele cinci proprietăţi. În adevăr ele sunt caracterizate
prin existenţa unui punct zero real şi prin posibilitatea de a trata rezultatele măsurătorii
prin toate cele patru operaţii aritmetice fundamentale.
Puţine sunt scalele utilizate în psihologie care se încadrează în această categorie. Un
exemplu îl constituie scala de intensitate a zgomotului, unde valoarea zero semnifică
absenţa oricărei surse de zgomot.
Un alt exemplu de măsurătoare de tip scală raport poate fi găsit în studiul timpului de
reacţie. În adevăr, în acest caz punctul zero înseamnă că reacţia subiectului la vederea
stimulului are loc instantaneu. Nu este locul aici să explicăm de ce în realitate subiecţii
obţin timpi mai mari de zero. Timpul de reacţie mediu al unui subiect se obţine prin
utilizarea tuturor celor patru operaţii aritmetice (L.Tyler şi B. Walsh op. cit.).
Un alt exemplu care ilustrează modul cum funcţionează acest sistem de măsurare este
următorul: Să presupunem că sarcina de evaluare a disciplinelor şcolare este formulată de
această dată astfel (D. McBurney, 1983): “ Dacă pe o scală cu capetele libere (open-
ended scale) preferinţa ta pentru fizică se situează la gradaţia 10 unde se vor situa
matematica, informatica, geografia şi sportul? Dacă o disciplină îţi este indiferentă
noteaz-o cu zero. Dacă pe una o preferi de două ori mai mult decât pe alta, acordă-i un
punctaj de două ori mai mare. Dacă o disciplină iţi displace acordă-i un punctaj negativ.
Utilizează orice număr, pozitiv sau negativ, pe care îl consideri necesar, nefiind nici o
limită în sus sau în jos pe scală. Să mai presupunem că elevul a dat următoarea evaluare:
30
20 Matematica
15
10 Fizica
0 Informatica
-10 Geografia
-20
-30 Sportul
-40
Regula după care atributelor, obiectelor sau evenimentelor, le sunt ataşate numere în
acest sistem de măsurare este următoarea: raporturile (proporţiile) dintre numerele de pe
scală trebuie să fie corespunzătoare raporturilor (proporţiilor) psihologice dintre
evenimente sau obiecte (Aici, asemenea autorilor citaţi mai sus, utilizăm noţiunea de
obiect în sensul său cel mai general de obiect matematic).
Adevărul este că marea majoritate a măsurătorilor variabilelor psihologice se încadrează
în al treilea nivel, al scalelor interval, sau este de dorit să fie astfel. Lipsa unui zero real
trebuie să ne amintească mereu că din păcate nu putem utiliza oricare operaţie aritmetică
atunci când dorm să interpretăm rezultatele la un test. De asemenea, operaţiile
matematice sofisticate pot fi uneori lipsite de sens când datele obţinute într-o cercetare
aparţin unuia dintre nivelurile elementare ale sistemului de măsurători eleborat de
Stevens. Altfel spus, nu toate operaţiile aritmetice care se aplică numerelor au sens în
domeniul scorurilor la teste sau în evaluarea caracteristicilor psihologice. Dintre toate
tipurile de scale studiate scara raport este cea ma puternică, în sensul că ne permite să
derivăm toate informaţiile pe care ni le prezintă celelate scale, enumerate în ordinea
descrescătoare a aportului lor informaţional: cu intervale, ordinală şi nominală.
Putem identifica şi o ordine inversă, aceea a aşa numitelor “transformări permisibile “ (D.
McBurney, 1983). Este vorba de numărul permis de procedee de a atasa numere unor
atribute psihice în limitele regulilor permise de fiecare scală de măsurare.
Întorcându-ne la exemplificările efectuate în legătură cu fiecare sistem de măsurare, scara
nominală permite cea mai mare libertate în sensul că, semnificaţia tipurilor nu se schimbă
dacă le ataşăm numere de la o mie în sus sau dacă le ataşăm literele alfabetului cu
condiţia ca etichetele să fie diferite şi să nu permită nici o confuzie.
De asemenea numerele din scala ordinală pot fi schimbate în orice fel cu condiţia să fie
conservată ordinea preferinţei. În cazul scării interval putem aduna sau scădea, înmulţi
sau împărţi numerele printr-o constantă fără ca semnificaţia diferenţelor (distanţelor)
dintre materiile preferate să se schimbe.
Dimpotrivă în cazul scalelor raport putem schimba numerele care corespund treptelor
scării apreciative doar prin multiplicarea lor printr-o constantă pozitivă.
Fireşte cercetătorul trebuie să facă efortul de a găsi în experimentele sale acele variabile
care se pretează a fi măsurate cu scara ordinală deoarece în cadrul acestui sistem de
măsurare sunt permise toate operaţiile aritmetice, deci pot fi surprinse mai multe relaţii
care sunt atribuibile fenomenului psihic investigat.
Pe de altă parte trebuie să înţelegem şi pericolele unor interpretări eronate care pot
surveni când unor date obţinute prin măsurători, de exemplu ordinale, le aplicăm
proceduri matematice sofisticate care în acest context sunt lipsite de sens. De exemplu
este complet eronat să spunem că un subiect care a rezolvat 40 de itemi la testul Matricile
Progresive Standard este de două ori mai bun decât un altul care a rezolvat doar 20.
Pentru a efectua astfel de comparaţii aceste măsurători sunt convertite în altele de un cu
totul alt tip numite clase normalizate sau note standard, acestea din urmă aparţinând
scalei de tip interval. Adesea măsurători efectuate pe o scală inferioară sunt transformate
prin formule matematice adecvate în mărimi care aparţin unei scale de măsurare
superioare d.p.d.v. al operaţiilor matematice permise.
Către sfârşitul secolului al XIX-lea Lambert A. Quetelet, matematician belgian a observat
că variaţiile individuale în domeniul măsurătorilor fiziologice tind să se conformeze unei
anumite ordini. Ulterior Galton, în Anglia, a aplicat metoda lui Quetelet în domeniul unor
variabile psihologice cum este acuitatea vederii. Efectuând măsurători ale unor variabile
psihologice dar şi fiziologice (circumferinţa toracelui) pe grupuri mari de soldaţi (în total
aprox 5000) Galton a ajuns la concluzia că regularitatea după care tind să se distribuie
diferenţele individuale se supune unei legi universale.
CAPITOLUL III PLANURI EXPERIMENTALE
Modelele experimentale pot fi clasificate în baza mai multor criterii care se diferenţiază
funcţie de gradul lor de generalitate.
Figura nr.1 (pagina următoare) reprezintă o încercare de taxonomie în domeniul
modelelor experimentale. Ea poate fi utilizată de către studenţi dar şi de către alte
persoane interesate de demersurile eperimentale ca un ghid pentru înţelegerea sau
acceptarea critică a unei lucrări ştiinţifice care comunică rezultatele unui anumit
experiment psihologic.
Unul dintre cele mai generale criterii de clasificare a modelelor experimentale este acela
al numărului de subiecţi. Din această perspectivă putem vorbi de modele în care se
experimentează pe un singur subiect şi
modele în care mai mulţi subiecţi parcurg condiţiile experimentale.
Un alt criteriu, la fel de general, cum este cel privind modalitatea de constituire a
grupurilor experimentale, adică prin randomizare sau fără randomizare împarte design-
urile în experimente propriu-zise (cu randomizare) şi cvasiexperimente (Cook şi
Campbell, op. cit.). Asupra randomizării şi cvasiexperimentelor vom zăbovi îndeajuns în
capitolele cinci şi respectiv opt.
Din punct de vedere al gradului de control asupra variabilelor experimentale, distingem
experimentele propriu-zise sau adevărate (true experiments) şi cvasiexperimentele sau
aşa-zisele experimente ex post factum.
Din punct de vedere al numărului de variabile implementate (manipulate, sau studiate
simultan) deosebim modelele cu o singură variabilă, de modelele complexe sau
factoriale. Unii autori atribuie denumirea de experiment factorial acelora unde variabilele
au acelaşi număr de nivele sau modalităţi.
O serie de alte criterii mai puţin generale determină grupări în interiorul categoriilor
formate de criteriile anterioare.
Astfel, în interiorul modelelor experimentale complexe, funcţie de tipurile de variabile
implementate, distingem planurile omogene (conţin variabile de acelaşi tip) de modelele
mixte (utilizează simultan tipuri diferite de factori).
În cadrul grupei de planuri experimentale care operează cu o singură variabilă, funcţie de
frecvenţa cu care o condiţie experimentală este dată subiecţilor, avem:
a) Planuri cu grupuri independente, fiecare subiect parcurgând o condiţie experimentală o
singură dată. Conţin variabile de tip intersubiect; mai sunt numite „between-subjects
designs”.
La rândul lor, planurile experimentale cu grupuri independente (independent groups
design) sunt clasificate de Shaughnessey, et. al. (1998) astfel: modele cu grupuri
randomizate, modele cu grupuri egalizate şi modele cu grupuri naturale.
b) Modelele experimentale cu măsurători repetate. Ele au implementate, aşa cum am
văzut în capitolul precedent, variabile de tip intrasubiect; fiecărui subiect i se aplică de
mai multe ori acelaşi tratament. Din această cauză, mai sunt numite „ within-subject
designs”.
Trebuie menţionat că cele două tipuri de modele, anume cele cu grupuri independente şi
cele cu măsurători repetate (inter’ şi intrasubiecţi) permit tipuri de comparaţie diferită.
Astfel în cadrul modelului intersubiect comparaţia mediilor performanţelor experimentale
are loc între grupurile distincte alocate nivelurilor variabilei independente. Dimpotrivă
modelul intrasubiect se bazează pe comparaţii efectuate între performanţele aceloraşi
subiecţi obţinute pe măsură ce trec de la o modalitate experimentală la alta, adică de la un
nivel la altul al variabilei independente.
Factorii (variabilele) de tip intersubiect (between – subjects factors) sunt factori cu
randomizare completă. În dizainurle experimentale care utilizează acest tip de factori,
subiecţii sunt mai întâi egalizaţi din punctul de vedere al unor variabile care ar putea
influenţa într-un sens nedorit rezultatele experimentului (sex, vârstă, nivel de studii,
profesie, etc.), apoi sunt repartizaţi în mod aleatoriu la condiţiile experimentale.
În cazul factorilor de tip intrasubiecţi (within-subjects factors) subiecţii, alocaţi prin
randomizare, parcurg toate nivelele specifice unui factor. Această modalitate este
specifică design-urilor utilizate în evaluarea eficacităţii diferitelor condiţii experimentale:
procedee de învăţare sau de predare, formule psihoterapeutice, etc. Performanţele
subiecţilor sunt evaluate prin măsurători repetate, de exemplu la începutul şi la sfârşitul
fiecărui tip de tratament.
Experimentele de acest tip întâmpină două tipuri de dificultăţi:
1) Deoarece sunt comparate performanţele aceluiaşi subiect în condiţii experimentale
diferite, este posibil ca rezultatele la un tratament consecvent să fie influenţate de
tratamentul precedent.
De exemplu, într-un experiment care testează impactul asupra calităţii percepţiei a două
niveluri de iluminare a spaţiului de lucru (intens şi slab), performanţele într-o sarcină de
discriminare perceptivă, obţinute la un iluminat inferior, ar putea să fie cu atât mai reduse
cu cât iluminatul precedent a fost mai intens. Pentru contracararea acestui efect se
utilizează metoda contrabalansării: jumătate dintre subiecţi vor efectua sarcina de
discriminare perceptivă mai întâi în condiţii de iluminat slab şi apoi în condiţii de
iluminat intens. Cealaltă jumătate va parcurge cele două condiţii experimentale într-o
ordine inversă.
2) În unele experimente care evaluează eficacitatea unor tratamente, prin măsurarea
repetată a performanţelor aceloraşi subiecţi, este posibil să intervină aşa-zisul efect de
ordine: un tratament A este mai eficient când este precedat de tratamentul B decât când
urmează sau precedă tratamentele C şi D.
În astfel de situaţii Vadum şi Rankin (op. cit.) propun tratarea ordinii ca un factor distinct
al planului experimental. Cele trei condiţii experimentale A, B, C, vor fi combinate în
toate tipurile de ordine posibile, adică şase: ABC, ACB, BCA, BAC, CBA, CAB.
Fiecărei variante îi vor fi alocaţi, prin randomizare, subiecţi diferiţi. Această metodă are
dezavantajul că necesită un număr cu atât mai mare de subiecţi cu cât numărul
tratamentelor cuprinse în plan este mai mare. Astfel, dacă pentru trei condiţii
experimentale rezultă şase combinaţii, pentru patru vor fi posibile 24 de secvenţe, iar
pentru cinci vor rezulta 120 de variante. Deoarece pentru fiecare tip de ordine se vor
aloca prin randomizare alţi şi alţi subiecţi, pentru testarea celor cinci tratamente ar trebui
un număr de 120 de subiecţi. Observăm că subiecţii sunt repartizaţi în mod aleatoriu la
fiecare secvenţă de ordine a condiţiilor experimentale. În experimentale cu mai multe
condiţii experimentale, repartizarea subiecţilor prin randomizare la aceste tipuri de
tratamente contracarează efectul de ordine, aşa cum repartizarea întâmplătoare a
subiecţilor la grupuri controlează efectele diferenţelor individuale.
Un alt criteriu care funcţionează în interiorul categoriei de experimente cu grupuri
independente poartă asupra modului de alocare a subiecţilor la grupurile experimentale şi
din acest punct de vedere modelele experimentale se clasifică în:
Funcţie de modul în care subiecţii sunt repartizaţi pe condiţiile sau nivelele variabilei
independente, planurile cu grupuri randomizate (planurile itersubiecţi) se împart în
design-uri cu randomizare completă (subiecţii sunt repartizaţi la condiţii pe criterii
complet aleatoare) şi design-uri cu randomizare în blocuri (subiecţii sunt repartizaţi mai
întâi pe blocuri, apoi acestea sunt parcurse într-o ordine aleatoare).
Înţelegerea logicii unui anumit experiment, aşa cum este el prezentat într-o revistă de
psihologie, presupune mai întâi un demers analitic prin care sunt identificate variabilele
independente şi nivelurile, respectiv tratamentele sau condiţiile experimentale ale
acesteia. Dacă pentru fiecare variabilă identificată este parcursă schema din figura 1 §
3.1, se poate accede cu uşurinţă la tipul de plan experimental cu o singură variabilă care a
stat la baza implementării acelei variabile. Ulterior, funcţie de tipurile de variabile
independente utilizate, se poate conchide cu privire la tipul de plan complex care a fost
utilizat de cercetător sau poate fi ales acel model care este cel mai bine adecvat problemei
care urmează să fie abordată experimental.
În continuare câteva precizări terminologice ni se par extrem de necesare.
Preferăm termenul model experimental atunci când vrem să desemnăm un anumit tip mai
general de experiment, aşa cum de pildă este modelul cu grupuri independente. Atunci
când ne referim la specii de modele preferăm termenul de plan, aşa cum, de pildă,
modelul experimental cu grupuri independente cuprinde planurile cu grupuri
randomizate, planurile cu grupuri egalizate şi design-urile cu grupuri naturale.
Experimentele concrete reprezintă, în ordinea generalităţii, ultima verigă în această
ierarhie.
De asemenea, relativ la variabila independentă sunt echivalenţi termenii, nivel,
modalitate, condiţie, tratament, stimul, etc.
Se regăsesc în experimente ca atare, cu o singură variabilă, sau cel mai adesea combinate
cu un alt sau (mai rar) cu alte modele experimentale cu o singură variabilă. Dintr-o
perspectivă opusă putem afirma că orice experiment cu design experimental complex
poate fi divizat în atâtea modele experimentale cu o singură variabilă, câte variabile
independente are implementate.
Sunt preferate experimentele de tip factorial care iau în considerare acţiunea simultană şi
interacţiunea mai multor variabile în producerea unui anumit efect. Totuşi, atunci când
sunt utilizate experimente cu o singură variabilă independentă este benefic, pentru
validitatea experimentului, ca singura variabilă implementată să aibă mai multe
modalităţi iar acestea să fie administrate, după caz, fie aceloraşi subiecţi (design cu
măsurători repetate) fie unor grupuri distincte (design cu grupuri independente).
Cazul cel mai elocvent este acela al testării diferitelor metode de predare. Variabila
independentă este metoda de învăţare care cuprinde mai mult de două posibilităţi
respectiv, metoda globală, metoda fracţionată progresivă, metoda fracţionată repetitivă,
etc. Acestea sunt modalităţile variabilei independente. Prin manipularea variabilei
independente de-a lungul acestor modalităţi este de aşteptat să înregistrăm o serie de
variaţii în variabila dependentă, adică în nivelul competenţelor dobândite de subiecţi.
Sunt de preferat experimentele cu mai multe valori ale variabilei independente atunci
când dorim să determinăm forma grafică a funcţiei care descrie relaţia dintre variabila
independentă şi cea dependentă. Un alt motiv pentru care cercetătorii preferă acest tip de
model experimental este acela al eliminării altor explicaţii posibile privitoare la datele
obţinute.
Sunt denumite astfel toate planurile experimentale, care, spre deosebire de cele cu
măsurători repetate, compară grupuri distincte, despre care se presupune în ipoteză că
sunt selecţii ale unor populaţii diferite din punctul de vedere al efectului variabilei
independente. În general numărul de grupuri este egal cu numărul de niveluri, valori sau
modalităţi ale variabilei independente. Aceasta înseamnă că fiecare grup va parcurge o
singură condiţie experimentală, sau cu alte cuvinte, fiecărui grup i se va administra o
singură valoare a stimulului. Atributul de independent are semnificaţia că în constituirea
grupurilor comparate nu a funcţionat nici o intenţie în virtutea căreia un grup ar avea
subiecţi care se regăsesc în celelalte grupuri sau ar împărtăşi caracteristici comune altor
grupuri cu care este comparat.
Există situaţii când nu este eficient să experimentăm cu grupuri independente care să fie
alocate separat, diferitelor niveluri sau modalităţi ale variabilei experimentale.
Planurile cu măsurători repetate presupun trecerea fiecărui subiect prin toate condiţiile
experimentale. Ele utilizează variabile de tip intrasubiect şi sunt design-uri within
subject. Întrucât fiecare subiect este comparat cu sine însuşi, acţiunea acestor diferenţe
este estompată. Aceste design-uri nu trebuie confundate cu unele situaţii când repetarea
măsurătorilor nu urmăreşte evidenţierea unei relaţii de tip cauză efect ci doar verificarea
consistenţei interne, respectiv a constanţei (fidelităţii) unor rezultate obţinute cu ajutorul
unor teste psihologice.
Acest design se pretează foarte bine în domeniul cercetărilor psihofiziologice, cu condiţia
să existe un timp suficient de mare între stimulări pentru a elimina efectele adaptării.
Exemplificăm cu experimentul realizat de John Marshall şi Philip Teitelbaum (1974) pe
subiecţi, pisici cărora li se îndepărtase partea laterală stângă sau dreaptă a
hipotalamusului. Variabila independentă a avut două modalităţi: prezentarea şoricelului
pradă la stânga sau la dreapta câmpului vizual, respectiv în zona afectată a vederii sau în
zona neafectată. Se ştie că în partea stângă a câmpului vizual este implicat hipotalamusul
drept şi invers. Performanţele subiecţilor, adică atacarea şoarecelui pradă, au fost
comparate pentru fiecare individ pentru situaţia de coincidenţă cu aceea de necoincidenţă
a prezentării stimulului în zona afectată a câmpului vizual.
În acest plan experimental toţi subiecţii parcurg fiecare tratament. Teoretic numărul
minim de subiecţi necesari este egal cu unu. Subiectul va parcurge rând pe rând toate
situaţiile experimentale (toate combinaţiile dintre fiecare modalitate a unei variabile cu
toate celelalte modalităţi ale celei de-a doua variabile independentă). Fireşte că, întrucât
nici o statistică nu este posibilă pe baza unei singure observaţii, acesta este un caz rar, dar
comod pentru înţelegerea specificului planului experimental cu măsurători repetate. Cum
în mod obişnuit se utilizează un anumit număr de subiecţi, rezonabil din punct de vedere
statistic, ordinea de parcurgere a unei succesiuni de condiţii sau stimuli va trebui să fie
pentru fiecare subiect mereu alta pentru a nu avantaja vreo situaţie în raport cu altele.
Atunci când fiecărui subiect urmează să i se aplice toate condiţiile prevăzute în modelul
experimental este nevoie să utilizeze procedura randomizării ordinii în care vor fi
administrate situaţiile experimentale. Ea este cu atât mai necesară în situaţiile când
fiecare stimul urmează să fie administrat de mai multe ori. În acest caz se utilizează
randomizarea în bloc, procedură care constă în a parcurge aleatoriu fiecare situaţie
experimentală de două ori dar niciodată succesiv, şi cu interpunerea cel puţin a unei alte
condiţii experimentale între două repetiţii astfel: B D A C A C D B.
Este bine să se utilizeze acest model ori de câte ori este posibil ca un eficient mijloc de
control al variabilităţii individuale a performanţelor cu respectarea a două condiţii de
bază:
(1) Dacă trecerea unui subiect printr-o condiţie experimentală nu va afecta participarea sa
la condiţia următoare sub aspectul sensibilităţii nemodificate sau al păstrării
confidenţialităţii scopului cercetării;
(2) Condiţiile experimentale nu vor produce efecte contrastante asupra comportamentului
de răspuns ca atunci când un subiect învăţând o procedură printr-o anumită metodă
trebuie să reînveţe aceeaşi procedură printr-o metodă diferită, fapt care este practic
imposibil.
Există două tipuri de modele experimentale în care măsurătorile sunt repetate: design-ul
complet şi planul incomplet. În cazul primului model, deoarece fiecare subiect este trecut
prin toate tratamentele, se poate spune că experimentele aplicate unui singur subiect
formează un experiment complet.
În design-ul incomplet nu sunt utilizate toate condiţiile experimentale, iar acestea sunt
administrate unui subiect o singură dată. Este cazul modelului experimental în pătrat latin
şi a modelului bazat pe rotirea unei ordini de start care a fost obţinută prin randomizarea
ordinii iniţiale a condiţiilor experimentale (random starting order with rotation).
3.2.2.2 Dezavantaje
Cel mai simplu plan factorial este de tipul 2 x 2, fiecare din cele două variabile
independente având câte două valori (modalităţi).
Faptul că un plan bifactorial cuprinde o variabilă cu două nivele iar alta are trei modalităţi
este simbolizat astfel: 2 x 3. De asemenea, un plan cu trei variabile poate lua forma 2 x 4
x 2, dacă prima variabilă are două modalităţi, a doua are patru, iar a treia are două nivele.
Planul bifactorial se prezintă grafic ca un tabel cu două intrări, una dintre ele fiind alocată
unei variabile independente iar a doua fiind destinată celei de-a doua variabile
independente. Numărul pătratelor interioare rezultate din intersecţia liniilor şi coloanelor
este echivalentul numărului tratamentelor sau condiţiilor controlate prin experiment.
Numărul tratamentelor este egal cu produsul nivelelor sau modalităţilor variabilelor
independente.
Să presupunem un plan bifactorial pentru cercetarea efectelor conjugate ale metodelor de
predare şi ale motivaţiei învăţării asupra randamentului şcolar. Prima variabilă
independentă are două modalităţi: AI predare cu accent pe informaţie, AII- predare cu
accent pe rezolvarea de probleme. A doua variabilă independentă are trei nivele: BI
-motivare slabă, BII – Motivare medie, BIII – motivare înaltă. Reprezentarea grafică a
acestui model va fi un tabel cu 6 căsuţe, acestea corespunzând numărului condiţiilor
experimentale care vor fi parcurse de subiecţii de experiment: două modalităţi ale
variabilei A înmulţite cu trei modalităţi ale variabilei B dau şase condiţii (tratamente)
experimentale. Acestea sunt: A1,B1; A1,B2; A1,B3; A2,B1; A2,B2; A2,B3. Pentru
comoditatea analizelor statistice sunt preferate modelele factoriale unde numărul
modalităţilor celor doi factori este acelaşi.
Iată, în continuare, un design bifactorial, unde numărul nivelelor celor două variabile
independente este egal. Într-o cercetare proprie au fost studiate efectele combinate a două
variabile independente trebuinţa de realizare şi declinul unor procese cognitive asupra
comportamentului profesional. Este un experiment cu variabile invocate.
Un experiment factorial este acela în care sunt manipulate cel puţin două variabile
experimentale având fiecare două sau mai multe modalităţi (nivele, valori) şi o variabilă
dependentă. În modelele factoriale variabilele independente poartă denumirea de factori.
Sensul acestui termen este diferit, neavând nimic comun cu acela care este utilizat în
analiza factorială.
54
slabi
49 buni
exista nu exista
declin declin
A ,B,C,D,E
X1Y1 X1Y2
A,B,C,D,E
X2Y1
A,B,C,D,E A,B,C,D,E
X2Y2
A
X1
Y1 B
X1
Y2 C
X2
Y1 D
X2
Y2 E
X1
Y2 A
X1
Y2 B
X2
Y2 C
X1
Y1 D
X2
Y1 E
X1
Y1
A
X2
Y1 B
X1
Y1 C
X2
Y2 D
X1
Y2 E
X2
Y1 A
X2
Y2 B
X2
Y1 C
X1
Y2 D
X1
Y1 E
X2
Y2
Figura 7. Design bifactorial având contrabalansată ordinea
condiţiilor experimentale
Operarea cu ambele variabile le-a permis celor doi cercetători să constate că iluzia
mărime-greutate este mai mare la ridicarea obiectelor mai uşoare şi este cu atât mai mică
dacă obiectele ridicate sunt mai mici. Efectul dispare la ridicarea greutăţilor care
reprezintă limita noastră superioară, indiferent de mărimea obiectelor.
Modelul factorial în care fiecărei condiţii experimentale îi este alocat un alt grup este
ilustrat de figura 7 unde grupurile G1,G2,G3,G4 au în componenţa lor subiecţi diferiţi,
respectiv:
G1 (A,B,C,D,E), G2 (F,G,H,I,J), G3 (K,L,M,N,O), G4 (P,R,S,T,U).
G1
G2
G3
G4
Cercetările efectuate după acest model sunt destul de neeconomice deoarece necesită un
număr de subiecţi de patru ori mai mare decât în experimentele factoriale de tip
intrasubiect.
Richard Barnes şi Robert Kidd (1979) au manipulat în experimentul lor două variabile şi
anume, nivelul de intenţionalitate (intenţionat-neintenţionat) în luarea notelor de curs şi
stabilitatea trebuinţei de a proceda astfel care a avut două modalităţi: stabilitate (cei care
au răspuns că întotdeauna iau note de curs de proastă calitate), instabilitate (cei care
uneori iau note de proastă calitate). Variabilele sunt de tip ex post facto pentru că
cercetătorii au identificat cu ajutorul chestionarului atitudini preexistente în populaţia
studenţilor. Variabila dependentă a constituit-o disponibilitatea altor studenţi de a da cu
împrumut notele lor celor două categorii de colegi. S-a constatat că cele două variabile nu
interacţionează, deci că nu au un efect comun. Aveau şanse să primească cursuri cu
împrumut cei care erau constanţi în luarea notiţelor şi cei care invocau lipsa de pricepere
(nivelul neintenţionat al primei variabile independente).
3.6 Efecte principale (main effects)
Într-un plan experimental cu mai multe variabile independente efectele unei variabile
asupra variabilei dependente reprezintă de fapt rezultatul interacţiunii ei cu celelalte
variabile independente.
Specificul efectelor şi interacţiunilor dintr-un plan complex iese cel mai bine în evidenţă
în experimentele bifactoriale. De aceea, spre exemplificare, să luăm în discuţie un
experiment întreprins de Hass (Hass et. al. 1991) prin care au investigat influenţele
apartenenţei la o anumită rasă asupra modului cum sunt evaluate persoane din aceeaşi
rasă, comparativ cu persoane aparţinând altei rase. Ei au experimentat cu studenţi
aparţinând rasei albe care au fost împărţiţi în patru grupuri mici.
Participanţilor la experiment li s-a comunicat că participă la realizarea unui joc în forma
concursului de întrebări, joc destinat unui anumit colegiu. În fiecare grup a fost introdus
un complice.
Experimentatorii au manipulat scrutinul astfel încât, în calitate de căpitan al grupului să
fie ales complicele desemnat. Rasa căpitanilor (albi, negri) a constituit prima variabilă
independentă. Funcţie de instructajul primit, căpitanii alegeau întrebările (uşoare sau
dificile) la care grupul trebuia să găsească răspunsurile corecte într-un timp limitat.
Funcţie de nivelul de dificultate al întrebărilor strădaniile grupurilor erau urmate de
succes sau de eşec, acest rezultat constituind cea de-a doua variabilă independentă.
Experimentul concretizează un plan factorial de tipul doi ori doi, având, deci, patru
condiţii experimentale: căpitani albi cu succes, căpitani negri cu succes, căpitani albi cu
eşec, căpitani negri cu eşec în rezolvarea de către grupul condus a întrebărilor alese.
După concurs, fiecare participant a completat un chestionar prin care a evaluat căpitanul
grupului său. Mediile evaluărilor primite de fiecare căpitan sunt date în tabelul următor.
Efectul principal al variabilei Performanţa grupului se determină apelând la statistici
descriptive, astfel:
Se calculează media generală a modalităţii succes a acestei variabile,• însumând mediile
căpitanilor albi şi negri şi împărţind rezultatul la doi, adică (309.6 + 280.9) / 2 = 590 / 2 =
295.2.
Se procedează într-un mod asemănător la calcularea mediei generale a• modalităţii eşec,
respectiv (155.3 + 196.1) / 2 = 351.4 / 2 = 175.7
Efectul principal al variabilei Performanţa grupului se determină• calculând diferenţa
dintre cele două medii generale, corespunzătoare celor două niveluri, eşec, respectiv
succes: 295 – 175.7 = 119.3
Se apelează la statisticile inferenţiale pentru a stabili dacă această diferenţă este statistic
semnificativă.•
Pentru calculul efectului mediu al celei de-a doua variabile independente, rasa căpitanului
se parcurg aceleaşi etape, cu ignorarea nivelurilor variabilei Performanţa grupului.
Se impune precizarea că procedura descrisă este valabilă doar dacă, în fiecare din
grupurile alocate condiţiilor experimentale rezultate din factorializarea nivelurilor
variabilelor independente, numărul subiecţilor este acelaşi.
Rezultă o medie generală de 238.5 pentru căpitanii albi şi alta de 232.4 pentru căpitanii
de culoare. Efectul principal al acestei variabile este: 238.5 – 232.4 = 6.1.
Mărimea în sine a acestor diferenţe nu este un indiciu sigur pentru semnificaţia lor
statistică. Pentru o interpretare corectă se apelează la statistica inferenţială constând în
testul t al diferenţei dintre medii. Fără a intra în detalii, deoarece vom reveni pe larg în §
6.9.1.1, potrivit ipotezei de nul, efectul principal ar trebui să fie egal cu zero. Dacă
nivelul de semnificaţie p<.05 ipoteza de nul va fi respinsă şi se va conchide că variabila
respectivă are un efect principal semnificativ. Acelaşi procedeu, simetric, se aplică pentru
determinarea efectului mediu al celei de-a doua variabile în raport cu fiecare modalitate
sau valoare a primei variabile.
Efectul principal al unei variabile (main effect) se determină, deci, prin calcularea
efectului acelei variabile la ambele niveluri al celei de-a doua variabile independente
(Vadum şi Rankin, 1998). „În orice plan factorial, observă Shaughnessey şi col. (op. cit.
pp. 304), este posibil să testăm predicţii privitoare la efectul general al fiecărei variabile
independente ignorând efectele altei (altor) variabile independente.”
Revenind la experimentul întreprins de Hass şi colaboratorii, să observăm că datele din
tabelul anterior sunt aparent contradictorii. Astfel, comparând mediile evaluărilor primite
de căpitani, ai căror grupuri au înregistrat succes la concurs, observăm o netă
superioritate a liderilor de culoare faţă de cei albi. Pe de altă parte, comparaţia mediilor în
condiţii de eşec conduce la un rezultat opus: căpitanii albi au fost mai bine evaluaţi decât
cei negri. Cu alte cuvinte, manipularea variabilei Performanţa grupului, de-a lungul celor
două modalităţi (succes, eşec), produce rezultate diferite, funcţie de rasa de apartenenţă a
căpitanului. În acelaşi mod, variabila rasă determină efecte diferite funcţie de faptul dacă
grupul condus eşuează sau are succes la concurs.
Figura 10. Interacţiuni între variabilele
experimentului condus de Hass
Toate aceste rezultate conduc la două concluzii extrem de importante pentru interpretarea
corectă a experimentului:
(1) Faptul că efectele unei variabile se modifică funcţie de nivelurile celeilalte variabile
este un indiciu că între aceste variabile are loc o interacţiune;
(2) Interpretarea efectelor principale într-un experiment poate genera semnificaţii
contradictorii dacă nu se ţine seama de interacţiunile care au loc între variabile. Mai mult,
aşa cum recomandă Shaughnessey et. al. (op cit. pp. 305) „ … efectele principale ar
trebui interpretate cu prudenţă ori de câte ori o interacţiune este prezentă într-un
experiment. Când nu are loc nici o interacţiune, efectele principale ale variabilelor
independente pot fi interpretate ca şi când acestea au fost manipulate în două experimente
separate fiecare cuprinzând o singură variabilă independentă.”
Interacţiunea care are loc între variabilele experimentului întreprins de Hass şi col. este
vizibilă în figura care urmează. Într-un sistem de coordonate rectangular, se obişnuieşte
ca pe ordonată să se reprezinte variabila dependentă iar pe abscisă una dintre variabilele
independente, în exemplul discutat, Performanţa grupului. Variabila rasa liderului este
reprezentată prin cele două linii, fiecare dintre ele indicând un nivel al acestei variabile.
Variabila reprezentată grafic se numeşte variabilă parametru.
Efectul principal este cu atât mai mare cu cât panta funcţiei matematice care îl descrie
este mai mare iar semnificaţia sa poate fi testată prin testul statistic Fisher (F). (vezi în
detaliu § 6.9.1.3)
Este vizibil în figură faptul că panta efectului mediu al variabilei rasa liderului are panta
mai abruptă, ceea ce confirmă ipoteza cu care a debutat experimentul, anume că
evaluarea persoanelor de altă rasă, decât evaluatorii, este mult mai polarizată decât
evaluarea persoanelor de aceeaşi rasă cu evaluatorii. În adevăr aşa cum se observă şi din
tabelul inclus în figura 9, căpitanii de culoare au fost evaluaţi mai bine decât cei albi în
condiţii de succes şi mult mai rău în condiţii de eşec, comparativ cu oponenţii lor.
Se mai impune o ultimă precizare. În principiu nu are importanţă care variabilă este
reprezentată grafic ca parametru şi care variabilă este reprezentată prin nivelurile ei
înscrise pe abscisa graficului. În figura anterioară ambele variabile independente sunt
reprezentate ca parametru. Se poate observa că variabila performanţa grupului moderează
de o manieră mai puţin radicală efectele celeilalte variabile. Totuşi, alegerea trebuie să
concorde cu ipoteza cercetării. De obicei variabila parametru este variabila care
moderează, într-un sens anticipat prin ipoteză, efectele unei anumite variabile
independente, aşa cum deja am arătat că este cazul în experimentul discutat.
3.7 Interacţiuni între variabile
Am văzut anterior că între două variabile are loc o interacţiune dacă efectul uneia dintre
ele asupra variabilei dependente depinde de valorile celeilalte. Cu alte cuvinte, o variabilă
A va avea un efect diferit asupra variabilei dependente dacă este combinată cu nivelul B1
al variabilei B decât dacă ar fi combinată cu nivelul B2 al aceleiaşi variabile.
Prin efectul variabilei independente, din punct de vedere formal, se înţelege forma sau
panta curbei care exprimă relaţia dintre variabilele independente.
În planul realităţii psihice efectul semnifică modificarea produsă variabilei dependentă,
adică schimbarea cauzată la nivelului unui anumit aspect al comportamentului, ca urmare
a manipulării experimentale a variabilei independente
O cale relativ simplă de a decide că există o interacţiune între două variabile este aceea de
a observa dacă cele două linii ale graf-ului sunt paralele sau nu. Dacă liniile sunt paralele
efectul este zero.
Dacă nu ţinem cont de interacţiunile care pot exista între variabilele independente ale
unui model experimental riscăm să ajungem la concluzii contradictorii, ca în
experimentul lui Hass discutat anterior.
Acolo unde efectul principal (main effect) este zero trebuie căutate alte variabile a căror
influenţă moderează efectul unei anumite variabile aflate în studiu. Saunders a introdus în
deceniul şase al secolului trecut noţiunea de variabilă moderatoare care condiţionează
relaţia dintre un predictor şi criteriu (varabila dependentă).
Mai trebuie adăugat că se obţine un grafic asemănător, dacă pe abscisă vom reprezenta
variabila rasa iar variabila succesul-insuccesul grupului va deveni variabilă parametru.
O interacţiune de tip antagonic există şi între variabila prezenţa- absenţa declinului
cognitiv, pe de o parte şi variabila parametru succesul profesional, în figura 4, § 3.4.
Se poate observa că faptul de a avea sau nu declin determină niveluri opuse ale trebuinţei
de realizare pentru subiecţii buni comparativ cu cei slabi profesional.
Altfel spus succesul la persoanele cu declin pare să fie determinat într-o mai mare măsură
de nivelurile înalte ale trebuinţei de realizare decât în cazul celor fără declin.
Principial, tendinţa statisticilor descriptive pe baza cărora se întocmesc graficele
interacţiunilor antagonice arată ca în tabelul următor.
Medie
mare Medie
mică
Medie mică Medie
mare
Cu cât diferenţele dintre medii, pe coloane, sunt mai contrastante cu atât graficile sunt
mai antagonice, exprimând o interacţiune mai puternică între variabilele planului
experimental. În tabelul 3 aceste diferenţe sunt:
În limbajul mediilor variabilei dependente acest fapt se exprimă astfel: diferenţa între
mediile variabilei dependente pentru nivelul scăzut al lui Vi este mai mică decât diferenţa
pentru nivelul înalt al lui Vi.
Tabelul ipotetic cu statisticile descriptive pentru graficul din figura 12 ar trebui să conţină
următoarele tendinţe ale mediilor variabilei dependente:
Medie
moderată Medie
mare
Medie
inferioară Medie
moderată
Efectul de plafon; (ceilling effect). Valoarea superioară a variabilei parametru Vp2 face
ca diferenţa dintre efectele celor două valori ale variabilei independente Vi1 şi Vi2 să fie
mai mică decât pentru Vp1.
Intuitiv vorbind, acest fapt se observă în figura 13 unde panta lui Vp2 este mai mică decât
a lui Vp1.
Medie
mare Medie
Foarte mare
Medie
mică Medie
mică
Pantele dreptelor care semnifică cele două niveluri ale variabilei parametru sunt
convergente în direcţia nivelului superior al variabilei independente. Şi în acest tip de
interacţiune efectele principale sunt semnificative.
Mare parte din concluziile teoretice obţinute din datele experimentale depind în întregime
de maniera în care reprezentăm grafic aceste date. Mai precis, prezenţa sau absenţa unei
interacţiuni, precum şi forma grafică pe care o ia depind completamente de tipul de
transformare la care sunt supuse datele primare.
Aşa cum observă McBurney (op.cit.) este vorba de o gândire circulară: Preferăm un
anumit tip de transformare din motive care ţin de teoria însăşi pe care apoi vrem să o
confirmăm, la rândul ei, prin acel tip de transformare.
Ce-i de făcut pentru a ieşi din acest cerc vicios ? Care transformări sunt oportune ? În
mod obişnuit se optează pentru transformările care produc date distribuite normal cu
egalitatea variabilităţii condiţiilor (variabilelor).
Vadum şi Rankin (op. cit.) menţionează trei avantaje principale ale acestei metode:
eficacitatea, caracterul cuprinzător şi validitatea externă.
1) Ideea eficacităţii este justificată prin numărul mare de comparaţii care pot fi efectuate
cu ajutorul aceluiaşi număr de subiecţi care sunt incluşi într-un experiment unifactorial şi,
implicit, prin cantitatea mai mare de informaţii pe care o produce. Într-un experiment
unifactorial cu un număr N de subiecţi care vor fi împărţiţi în două grupuri egale,
experimental şi de control vor fi posibile 2N / 2 comparaţii. Într-un experiment bifactorial
vor fi posibile 2(2N / 2) = 2N comparaţii. Dacă la acestea mai adăugăm cele două efecte
principale şi interacţiunea între variabile avem o reprezentare mai apropiată de
complexitatea reală a informaţiilor pe care le permite un experiment factorial, comparativ
cu unul unifactorial.
Acelaşi adevăr exprimat în unităţi de informaţie este mult mai sugestiv: Informaţia
maximă obţinută pe baza comparaţiilor între cele două eşantioane, într-un experiment cu
o singură variabilă independentă este E = N biţi. Într-un experiment factorial de tipul 2 x
2 cu variabilele A şi B avem : E = 2N biţi, la care se adaugă două comparaţii pentru
estimarea efectului principal al factorului A, adică 2N/4 biţi şi alte două comparaţii
pentru estimarea efectului principal al factorului B, respectiv 2N/4 biţi. Deci, E = 2N +
2(2N/4 ) = 3N biţi .
Menţinând numărul de subiecţi şi numărul de modalităţi constante, creşterea cu câte o
unitate a numărului factorilor în planul factorial determină o creştere exponenţială a
informaţiei. Din păcate, aşa cum remarcă Vadum şi Rankin (op. cit) planurile cu mai mult
de trei factori sunt greu, dacă nu chiar imposibil de interpretat.
2) Caracterul cuprinzător al modelelor factoriale este asigurat de posibilitatea testării
interacţiunilor între variabile.
3) Validitatea externă este evaluată prin posibilitatea de a testa efectul unei variabile de-a
lungul nivelelor celeilalte variabile, adică pentru toate condiţiile experimentale generate
de a doua variabilă. Dacă interacţiunea variabilelor nu este confirmată statistic, atunci
efectele pot fi generalizate pentru toate aceste condiţii. Dacă dimpotrivă interacţiunea
celor două variabile este confirmată de testul F al analizei de varianţă, generalizarea
rezultatelor pentru toate condiţiile luate în considerare este problematică.
O altă categorie de modele experimentale o constituie cele mixte care conţin atât
variabile independente intrasubiecţi cât şi variabile intersubiecţi (vezi în § 2.2), atât
variabile subiect cât şi variabile invocate. Variabila intrasubiect este ,,administrată”
fiecărui subiect în parte ca şi când ar fi un singur grup, pe când din punctul de vedere al
celeilalte variabile independente, care de cele mai multe ori este de tip invocat, sunt două
grupuri, iar modificările variabilei dependente sunt comparate intergrup, adică
intersubiecţi.
Spre exemplificare să luăm un experiment ipotetic în care o variabilă independentă este
vârsta (tineri-bătrâni) iar a doua variabilă independentă ar putea fi două momente
distincte ale unei zile de muncă, dimineaţa şi seara.
A,B,C,D,E,
A,B,C,D,E
F,G,H,I,J
F,G,H,I,J
Unele modele experimentale uzuale pot fi utilizate pentru rezolvarea unor probleme noi,
altele nu. Adesea trebuie creat un nou model experimental pentru a răspunde unei noi
probleme. El trebuie să răspundă optim problemei care urmează a fi clarificată şi
condiţiilor specifice pe care cercetătorul le are la îndemână.
În general proiectarea unui experiment constituie pentru cercetător un proces de rezolvare
de probleme specifice, cum este aceea al asigurării validităţii prin aplicarea unei anumite
metode de control.
Faza de proiectare a planului implică luarea unor decizii foarte importante privitoare la
mărimea eşantionului, metodele de control, modul de interpretarea a rezultatelor, etc. Un
plan valid este în acelaşi timp un plan elegant care întruneşte anumite condiţii estetice.
„Alegând cuvântul eleganţă, scrie D. McBurney, în mod deliberat m-am oprit asupra unui
termen care are o conotaţie estetică. Proiectarea unui experiment este o arta care
presupune creativitate şi care trădează gusturile experimentatorului” (op.cit., p. 107).
Experimentul elegant are prin urmare un plan simplu prin care se realizează verificarea
ipotezelor de o manieră clară şi convingătoare, apelând la tehnici riguroase de control.
Un bun experiment, potrivit lui Cook şi Campbell (op. cit.)
CAPITOLUL IV CONDIŢIILE
UNUI MODEL EXPERIMENTAL EFICIENT
Este cea mai importantă formă de validitate pentru că priveşte logica relaţiei dintre
variabila independentă şi cea dependentă (McBurney, 1983). Semnifică măsura în care
relaţia de tip cauză-efect dintre variabila independentă şi cea dependentă, relaţie postulată
în ipoteză, există cu adevărat în realitate. Mai specific, validitatea internă se referă la
capacitatea experimentului psihologic de a surprinde relaţii interpretabile de tip cauză
efect, adică de a infera drept cauză a modificărilor observate la nivelul variabilei
dependente, manipularea de către experimentator a variabilei independente
(Shaughnessy, E., Zechmeister, J., Zechmeister, 2000).
În anumite experimente este posibil să intervină o a doua condiţie experimentală (De
exemplu, cu grupul de control experimentăm într-o altă zi decât cu cel experimental) din
cauza căreia nu putem şti cât din modificările variabilei dependente este atribuibil
variabilei independente şi cât unei anumite condiţii diferite în care s-a efectuat cercetarea
(de ex. alte zile din săptămână; când avem suficiente informaţii că zilele diferite de
experimentare influenţează semnificativ răspunsurile subiecţilor).
Aceste experimente nu au validitate internă pentru că nu se ştie dacă efectele măsurate la
nivelul variabilei dependente sunt cauzate de variabila independentă deoarece ea a
covariat împreună cu o alta, anume cu zilele când a avut loc experimentarea.
Confuzia (confounding) între variabile „este acel tip de eroare, privind validitatea internă,
când efectele a două variabile independente nefiind posibil de separat, rezultă o anumită
confuzie în interpretarea rezultatelor. Confuzia variabilelor (a unei condiţii cu o variabilă
independentă) este una dintre cele mai mari ameninţări ale validităţii experimentelor”
(Vadum şi Rankin, op. cit. pp. 71).
În general o variabilă produce efecte dacă înregistrează o anumită variaţie. Dacă este
ţinută constantă aceasta nu produce efecte. De aceea o manieră eficientă de a elimina
efectul condiţiilor perturbatoare este aceea de a le menţine constante. În plan explicativ,
este eliminată posibilitatea unor explicaţii alternative cu privire la efectele observate în
comportamentul subiecţilor, inferenţa cea mai probabilă punând efectele pe seama
variaţiilor variabilei independente.
Cine ne spune care condiţii sunt şi care nu sunt covariante cu variabila independentă din
experimentul nostru? De obicei valorificăm experienţa personală şi aceea relatată de
autorii unor experimente (McBurney, 1983), orientându-ne spre cauzele alternative pe
care le considerăm plauzibile, spre factorii care ar putea afecta comportamentul studiat
dar fără a avea controlul tuturor influenţelor perturbatoare posibile. De aceea cercetătorul
nu exclude niciodată posibilitatea să fi omis sau să nu fi anticipat alte şi alte surse de
confuzie (Shaughnessy, E., Zechmeister, J., Zechmeister, 2000).
Cele mai multe confuzii sunt posibile atunci când nu putem controla variabila
independentă. Este cazul experimentelor ex. post factum (cvasi experimente) unde
variabilele sunt invocate (sexul, tranşe de vârstă, etc). De exemplu, în privinţa
diferenţelor de sex există o mare confuzie între variabila sex şi o serie de variabile
covariante cum sunt cele legate de influenţele sociale diferite la care sunt supuse
persoanele care le aparţin încă de la naştere. La fel, relaţia IQ – rasa este bruiată de o
serie de alte variabile care sunt confundate cu rasa: nivelul de educaţie al părinţilor,
nivelul de venit şi calitatea şcolilor la care copii de culoare au acces.
Nu este posibil un control complet al variabilelor care ar putea covaria cu variabila
independentă. Întotdeauna este posibil ca acţiunea unei variabile străine care permite o a
doua explicaţie, concurentă cu prima, să fie confundată cu acţiunea variabilei
independente, urmând ca cercetări ulterioare să reliefeze acest fapt.
Experimentul lui McGinnies efectuat în 1949 asupra apărării perceptive este concludent
pentru confuzia efectului variabilelor. Pe baza teoriei psihanalitice, McGinnies a emis
ipoteza că stimulii ameninţători vor declanşa mecanisme de apărare perceptivă pentru a
împiedica conştientizarea lor şi apariţia anxietăţii. Pe această bază în ipoteza cercetării s-a
prezumat că termenii tabu vor înregistra timpi de recunoaştere mai lungi decât cei neutri.
McGinnies a prezentat pe ecranul unui tahistoscop cuvinte tabu şi cuvinte neutre. Ipoteza
părea să fie confirmată deoarece subiecţii aveau nevoie de un timp de expunere mai lung
pentru a recunoaşte termenii cu încărcătură anxiogenă.
Totuşi după numai un an, în 1950 Howes şi Solomon (Vadum şi Rankin, 1998) au arătat
că relaţia dintre variabila independentă (prezenţa-absenţa încărcăturii anxiogene în
cuvintele stimul) şi variabila dependentă (timpul de recunoaştere) a fost interferată de o a
treia variabilă, frecvenţa celor două tipuri de cuvinte în limbajul curent.
Existenţa unei variabile străine face posibilă apariţia unei alte explicaţii la fel de
plauzibile, anume că lungirea timpului de răspuns s-ar datora frecvenţei mai reduse în
limbajul curent a cuvintelor tabu decât conţinutului lor anxiogen. Prin aceasta validitatea
internă a experimentului lui McGinnies a fost afectată.
În astfel de situaţii soluţia este aceea de a organiza un nou experiment în care cuvintele
tabu să fie însoţite de cuvinte neutre cu o frecvenţă egală. Acest experiment mai aşteaptă
încă să fie efectuat.
Validitatea unui experiment nu este doar o simplă opţiune pasivă, ci rezultatul unor
acţiuni sistematice întreprinse de cercetător pe toată durata experimentului, respectiv din
faza de proiectare şi până la finalizarea acestuia. În acest sens putem vorbi de validitatea
generală a unui experiment ca înglobând pe orizontală tipurile de validităţi discutate, iar
pe verticală, de fapt în ordine temporară, validitatea fiecărei faze a experimentului.
Acestea au fost shiţate de o manieră generală în § 1.9 şi vor fi reluate mai în detaliu în
capitolul şase.
VG = Vp x Vd x Vf
unde:
VG = validitatea experimentului
Vp = validitatea stadiilor pregătitoare ale
experimentului (identificarea problemei,
documentarea, emiterea ipotezei)
Vd = validitatea fazei de derulare a experimentului
Vf = validitatea fazei finale (prelucrarea şi
interpretarea experimentului)
Cea mai importantă ameninţare la adresa validităţii interne este aceea a confuziei dintre
efectele variabilei independente şi efectele altor variabile sau condiţii experimentale.
Existenţa efectelor unor variabile necontrolate conduce la posibilitatea unor explicaţii
alternative privind cauzele modificărilor observate în variabila dependentă. Probabilitatea
unor explicaţii alternative alimentează îndoiala că variaţiile sistematice ale variabilei
dependente s-ar datora manipulării experimentale a variabilei independente.
Cook şi Campbell (op.cit.) desprind două înţelesuri majore ale noţiunii de explicaţie
alternativă:
Ameninţările validităţii interne sugerează că ipoteza unei legături cauzale ar putea fi
eronată; Acest înţeles trimite la validitatea internă.
Operaţiile de manipulare a condiţiei A, respectiv de măsurare a efectului B reprezintă, în
adevăr, constructele intenţionate de cercetător. Acest înţeles ţinteşte validitatea de
construct.
O serie de autori (Cook şi Campbel, op.cit., Shaughnessey, et.al. op.cit., McBurney,
op.cit.), insistă pe decelarea unor condiţii care reprezintă ameninţări pentru validitatea
internă, respectiv pentru capacitatea experimentelor de a-şi atinge obiectivul esenţial,
acela de a permite inferenţe cauzale cu un înalt nivel de probabilitate. Ele merită a fi
enumerate, deoarece marea lor majoritate poate fi eliminată sau măcar atenuată chiar din
start, adică din faza de proiectare a planului experimental.
(Între pretest şi posttest subiecţii pot deveni mai maturi, mai înţelepţi, mai puternici, etc).
Aceste efecte sunt cu atât mai manifeste cu cât durata experimentului este mai mare.
Astfel un copil poate trece într-un alt stadiu psihogenetic dacă este cuprins într-un
experiment în care măsurătorile au loc repetat pe durata a mai multor luni. Aceste efecte
sunt posibile şi la adulţi sub forma modificărilor unor convingeri atitudini sau a nivelului
de experienţă.
Unii subiecţi pot fi avantajaţi deoarece au mai fost recrutaţi ca participanţi în experimente
similare. O serie de studii citate de A. Anastasi (1968) au relevat atenuarea fenomenului
de anxietate de examen (test anxiety) ca urmare a familiarizării subiecţilor cu sarcina
experimentală.
Este vorba de tendinţa subiecţilor, care la prima testare au obţinut scoruri extreme, de a
realiza scoruri mai apropiate de medie la a doua testare. Exemplele clasice sunt acelea al
elevilor care la prima testare a cunoştinţelor iau note mari iar la final obţin note mai mici
şi al elevilor care, după note mici, obţin ulterior note mai mari. Sunt indicii că nu
atitudinea elevilor faţă de învăţare este de vină ci eroarea produsă de întâmplare (random
error). Prin eroare întâmplătoare, deosebită de eroarea sistematică, se înţelege
modificarea măsurătorilor unei variabile datorată unor factori întâmplători. Cu alte
cuvinte există devieri întâmplătoare ale performanţelor subiecţilor de la scorurile lor
reale, în sensul că unii vor fi mai norocoşi alţii mai puţin.
Cook şi Campbell (op. cit.) pun acest fapt pe seama regresiei statistice.
Pierderea subiecţilor din eşantionul iniţial are la bază două mari categorii de cauze:
(a) Cauze care nu ţin de subiecţii înşişi cum sunt, de exemplu, defecţiuni în funcţionarea
aparaturii, greşeli datorate experimentatorului în administrarea stimulilor sau în
înregistrarea răspunsurilor, etc. Subiecţii, în cazul cărora se petrec astfel de evenimente
neplăcute, vor fi îndepărtaţi din eşantion şi se va consemna cu scrupulozitate motivul
omiterii acestor date din experiment. Shaughnessy şi col. (op.cit.) consideră că aceste
evenimente sunt aleatoare, pot avea loc în fiecare grup alocat prin randomizare la
condiţiile experimentale şi de aceea nu vor influenţa semnificativ rezultatele
experimentului;
(b) Cauze datorate subiecţilor înşişi (inconsecvenţă, incapacitatea de a continua
experimentul, boală, deces, etc.). Aceste pierderi au caracter selectiv, în sensul că de
obicei se produc mai frecvent într-un grup decât în celelalte. Aceasta afectează
comparabilitatea grupurilor care iniţial era realizată prin diferite tehnici de randomizare
pentru balansarea diferenţelor dintre subiecţi.
Minimizarea riscului deteriorării validităţii interne ca urmare a unor pierderi selective se
poate realiza prin testarea subiecţilor înainte de experiment, şi prin admiterea doar a celor
care întrunesc un nivel minim al caracteristicii comportamentale care urmează să fie
măsurată ca variabilă dependentă în experiment. Se diminuează astfel probabilitatea
abandonului experimentului ca urmare a unor eşecuri. Testarea iniţială mai poate fi
utilizată pentru a menţine echivalenţa (comparabilitatea) grupurilor prin eliminarea din
celelalte grupuri a unor subiecţi echivalenţi acelora care au părăsit un anumit grup. De
exemplu plecarea unui subiect din grupul experimental va determina renunţarea la un
subiect care a obţinut un rezultat echivalent la testul preexperiment.
Grupurile preformate sunt anterioare experimentului, aşa cum de pildă sunt clasele
şcolare, grupele de studenţi, echipele de muncitori dintr-o organizaţie industrială. Ele nu
sunt grupuri în înţelesul consacrat de psihologia experimentală, adică egalizate prin
randomizare.
De exemplu repartizarea aleatoare a unui anumit număr de clase a VII-a, dintr-o şcoală
elementară, la un experiment psihopedagogic, nu este suficientă pentru a balansa
diferenţele sistematice dintre aceste clase care sunt grupuri intacte. Clasele, sunt
constituite nu aleatoriu ci pe o serie de criterii ale şcolii şi ale părinţilor, conţinând ele
însele „germenii” unor selecţii anterioare care au generat o serie de diferenţe între clase.
Aceste diferenţe pot să se manifeste cu privire la capacităţile cognitive şi la motivaţia
şcolară a copiilor, la interesul părinţilor pentru educaţie, la prestigiul titularilor unor
discipline fundamentale în jurul cărora se polarizează interesul părinţilor de a înscrie
copilul la o clasă sau la alta. Cu o mare probabilitate validitatea internă a unui asemenea
experiment va fi afectată de posibilitatea confundării efectelor produse de manipularea
variabilei independente cu efectele produse de aceste diferenţe interindividuale asupra
variabilei comportamentale măsurate. Existenţa acestor diferenţe interindividuale
nebalansate sau neegalizate face posibile explicaţii alternative cu privire la efectele
înregistrate în variabila dependentă. Altfel spus, este posibil ca diferenţele înregistrate în
cursul experimentului între anumite clase să nu se datoreze tratamentelor diferite ci unor
deosebiri preexistente.
Insistăm asupra acestei surse de eroare deoarece, atât unii absolvenţi ai secţiilor de
psihologie sau psihopedagogie cât şi autorii unor lucrări ştiinţifice consideră, în mod tacit
şi în acelaşi timp eronat, clasele şcolare drept grupuri balansate, deci comparabile. Astfel,
un student, care testa ipoteza unor aptitudini artistice ca elemente diferenţiatoare între
clasele de la liceul de artă şi cele de la un liceu cu profil de matematică, era foarte
surprins că aceste diferenţe erau minore s-au chiar îi dezavantajau pe viitorii artişti. Cu
siguranţă că relaţia dintre opţiunea şcolară şi nivelul aptitudinii specifice profilului urmat
era interferată de o serie de alte variabile.
Sursa de ameninţare constă în implicarea, pentru fiecare condiţie testată, a câte unui
experimentator diferit. O serie de studii citate de A. Anastasi (op.cit.) şi Tyler, L.,E. &
Bruce Walsh, (1979) au relevat că reactivitatea subiecţilor sub aspect calitativ şi
cantitativ variază funcţie de unele caracteristici ale experimentatorului (vârsta, sexul,
nivelul de atractivitate, etc). Diferenţele interexperimentatori se vor suprapune peste
relaţia cauzală prezumată de ipoteză, făcând greu decelabile efectele variabilei
independente.
Unele variabile subiect pot funcţiona în experiment ca variabile străine. Este vorba de
unele caracteristici ale subiecţilor care participă la experiment, altele decât cele care
focalizează interesul cercetătorului.
Evans şi Donnerstein (1974) discută un anumit de tip de variabilă subiect şi anume locul
controlului (locus of control). Acesta este probabil de natură internă (internal locus) la
studenţii care se înscriu primii la experiment şi extern la subiecţii care se înscriu ultimii.
Este, astfel, posibil ca efectele comportamentale măsurate să nu se datoreze manipulării
variabilei independente ci diferenţelor dintre subiecţi privitoare la natura locului
controlului. Atenuarea efectelor variabilelor străine se realizează prin metoda
randomizării în blocuri (vezi § 5.5.1.1) care balansează efectele acestor variabile în toate
modalităţile, respectiv nivelele variabilei dependente. Astfel dacă variabila străină este
reprezentată de prezenţa mai multor experimentatori, asignarea blocurilor la fiecare
experimentator reprezintă o garanţie că toate condiţiile experimentale vor fi asignate
fiecărui experimentator din moment ce un bloc are în componenţa sa toate condiţiile
experimentale. Prezenţa mai multor experimentatori, ca sursă străină de variaţie, în
măsura în care este balansată prin blocurile randomizate, are ca efect creşterea
variabilităţii in interiorul grupurilor experimentale şi deci scăderea sensibilităţii
experimentului. O sensibilitate crescută este realizată atunci când grupurile comparate
sunt omogene iar diferenţa observată între ele, care este de dorit să fie cât mai mare, este
atribuită condiţiilor experimentale parcurse, adică variaţiei variabilei independente. Acest
fapt ar fi posibil păstrând un singur experimentator, ca o garanţie că răspunsurile
subiecţilor nu vor mai fi influenţate de această variabilă care acum este menţinută
constantă. Totuşi, utilizând într-un experiment un singur experimentator, un singur tip de
stimuli, reducem şansele de generalizare a rezultatelor. Parcurgând un raţionament ca cel
de mai sus, Shaughnessy şi col. ajung să generalizeze următorul principiu: „Controlul
variabilelor străine prin menţinerea lor constante conduce la experimente mai sensibile cu
o validitate externă mai redusă, pe când controlul obţinut prin balansarea lor determină o
mai scăzută sensibilitate dar şi o validitate externă mai mare” (op. cit. p. 228).
O serie de autori au fost preocupaţi de ameninţările validităţii care pot surveni din direcţia
fenomenelor psihosociale specifice situaţiei experimentale în care sunt implicaţi actori cu
aşteptări reciproce (participanţi şi experimentatori). Asupra acestei teme vom reveni în
detaliu în § 5.8
Cook şi Campbell (op. cit.) menţionează situaţiile când, tratamentul aplicat grupului
experimental ajungând să fie cunoscut grupului de control, are loc o gravă invalidare a
experimentului deoarece nu mai exsistă nici o diferenţă funcţională între grupurile
comparate.
Validitatea de construct este tipul de validitate cel mai greu de atins datorită faptului că
aceleaşi date experimentale pot fi explicate de către mai multe teorii. Strategia utilizată în
realizarea acestei validităţi este de a asigura că explicaţia datelor experimentale prin
teoria care a stat la baza experimentului este mai probabilă decât acelea oferite de
celelalte teorii aflate în competiţie. Validitatea teoretică a experimentului poate fi
diminuată de următorii factori:
(1) Operaţionalizarea greşită a conceptelor ce urmează a fi măsurate. Necunoaşterea sau
cunoaşterea superficială a fenomenului psihic cercetat îi poate conduce pe începători la
opţiuni extravagante. Este elocvent exemplul experimentului imaginar şi caricatural în
care anxietatea era „operaţionalizată” şi măsurată prin roaderea unghiilor iar învăţarea,
prin scrierea cu picioarele. Adesea, arată Mc Burney (op. cit.), utilizăm cuvinte cum este
de exemplu agresiunea pentru clase de comportament diferite. Definiţiile banale ale
conceptelor, cum a fost cazul rosului unghiilor pentru anxietate, riscă să nu surprindă
natura conceptului (notele sale esenţiale). În consecinţă aceste definiţii nu vor conduce la
măsurători valide. Cook şi Campbell (op. cit., p. 226) sunt chiar mai lapidari când
definesc ameninţările validităţii de construct drept „ameninţări la adresa corectei
denumiri a operaţiilor cauză şi efect în termeni abstacţi…” precum şi „a oricărui aspect al
unui experiment incluzând cadrul de desfăşurare, persoanele participante şi aşa mai
departe.”
(2) Inferenţe cauzale eronate. Relaţia cauzală dintre variaţiile sistematice ale variabilei
independente şi modificările variabilei dependente poate să fie doar aparentă, adică este
posibil ca efectele observate să se datoreze altor cauze decât cele afirmate în ipoteză.
Aceste situaţii pot interveni când nivelul de cunoaştere ştiinţifică nu oferă un suficient
suport teoretic pentru emiterea unor ipoteze pertinente. În psihologie, ca de altfel în
marea majoritate a ştiinţelor, relaţiile cauzale nu sunt vizibile ci sunt deduse. Nu doar
metoda ci mai ales conceptele unei teorii coerente ne asigură accesul la cauze. Pentru
exemplificare să revenim la experimentul Hawthorne. Cercetătorii verificau relaţia între
modificarea unor condiţii de mediu şi rezultatele muncii. Aparent, modificarea
sistematică a variabilei independente (condiţiile de muncă) era cauza ameliorării
randamentului în muncă. Totuşi psihologia socială a dezvăluit o întreagă fenomenologie,
subiectivă, inobservabilă care însoţeşte şi influenţează sistemul relaţiilor sociale dintr-o
organizaţie. Astăzi se ştie că nu stimulentele, în sine, sunt cele care determină hărnicia în
muncă, ci modul cum sunt ele percepute (de exemplu cât sunt de echitabile). În adevăr,
participantele la experimentul Hawthorne erau influenţate nu de noile condiţii, în sine, ci
de faptul că se ştiau implicate într-un experiment.
După o interpretare mai recentă a lui Bramel şi Friend, citaţi de Mc. Burney (op. cit.),
muncitorii erau suspicioşi faţă de manageri şi de aceea modificându-şi rezultatele muncii
ei au vrut să aibă controlul acelor condiţii de muncă ce aveau importanţă pentru ei, cum a
fost cazul pauzelor de lucru.
Toate acestea conduc la ipoteza unui adevărat efect de ambiguitate al variabilelor
independente care este potenţial activ dacă se ignoră teoria că experimentul psihologic, la
care subiecţii participă în mod voluntar, trebuie considerat ca o situaţie socială în care
participanţii vor să joace rolul de subiecţi buni (cum vrea experimentatorul ca ei să se
comporte), adică să procedeze în acord cu supoziţiile lor despre ce aşteaptă
experimentatorul de la ei.
Controlul reprezintă orice mijloc utilizat pentru eliminarea unei ameninţări la adresa
validităţii. El permite inferenţa relaţiilor de tip cauză-efect dintre variabila independentă
şi variabila dependentă.
Cel mai eficace mijloc de control îl reprezintă modelul experimental însuşi. Întrucât
raţiunea sa este asigurarea controlului, toate definiţiile judicioase ale modelului
experimental ar trebui să ia în seamă, ca pe o notă specifică, această însuşire.
Nu există design-uri experimentale perfecte care să fi eliminat toate sursele străine de
variaţie. Cu toate acestea marea majoritate a modelelor experimentale care reuşesc un
control eficace al variabilelor străine conţin două elemente de design. Acestea sunt:
Prin urmare noţiunea de control are în psihologia experimentală două înţelesuri mai
specifice:
(1) Primul, se referă la furnizarea unui standard, cu care se compară efectele unei anumite
variabile independente.
În marea lor majoritate experimentele cu grupuri independente utilizează ca standard un
grup experimental care cuprinde subiecţii cărora li aplică tratamentul, şi un grup de
control format din subiecţi care se aseamănă în toate privinţele cu cei din grupul
experimental cu excepţia faptului că ei nu primesc acest tratament.
Nu este obligatoriu ca un model experimental să aibă un grup de control deşi, aşa cum am
menţionat deja, este o cale eficace de a controla variabilele străine. Alte modalităţi mai
sunt:
Utilizarea a două grupuri egalizate care parcurg fiecare condiţii experimentale diferite (de
exemplu două metode de predare diferite). Diferenţele dintre grupuri, la sfârşitul
experimentului, sunt atribuite diferenţei existente între cele două condiţii experimentale.
Aici fiecare grup serveşte pentru celălalt ca grup de control.
Trecerea aceloraşi subiecţi prin toate condiţiile experimentale, adică prin condiţia
experimentală propriu-zisă şi prin condiţia de control. Condiţia experimentală propriu-
zisă este aceea în legătură cu care ne aşteptăm să confirme relaţia cauzală afirmată în
ipoteza ştiinţifică. Un astfel de model experimental constituie după McBurney (op. cit.)
una dintre cele mai puternice căi de control a variabilelor experimentale. În adevăr, într-
un plan experimental cu măsurători repetate (repeted measure design), deoarece variabila
implementată este de tip intrasubiect (within subject variable), comparaţiile efectuându-se
între performanţele obţinute de acelaşi participant, devine foarte eficace controlul
surselor de variaţie datorate diferenţelor dintre subiecţi. Totuşi, deoarece acest model nu
este ferit de ameninţarea explicaţiilor alternative, într-un paragraf viitor ne vom referi la
unele tehnici de contracarare a dezavantajelor care îi sunt specifice.
În planul experimental clasic condiţia de control, spre deosebire de condiţia
experimentală, nu conţine tratamentul care se aplică subiecţilor. În astfel de experimente
performanţele fiecărui subiect în sarcina experimentală sunt comparate cu cele obţinute în
situaţia de control. În acest fel se obţine o reducere considerabilă a erorii de variaţie
datorată diferenţelor dintre subiecţi.
(2) Al doilea înţeles al termenului control se referă la controlul experimental, adică la
abilitatea de a restrânge sau canaliza sursele de variabilitate în cercetare. Prin controlul
experimental se asigură validitatea internă a experimentului, ceea ce echivalează cu
creşterea probabilităţii inferenţelor cauzale.
Controlul experimental înseamnă limitarea surselor de variabilitate într-un experiment
până ce comportamentul devine înalt predictibil, adică acesta se manifestă ca un efect,
foarte probabil, al variabilei independente. Controlul se realizează prin:
Cea mai eficientă cale de a controla sursele de variaţie perturbatoare este de a alege un
design experimental cât mai adecvat problemei care urmează a fi cercetată. Decurge într-
un mod cât se poate de clar că, discutând despre metodele de control, avem în primul
rând în vedere tipurile de modele experimentale discutate în capitolul precedent.
Primele reguli de validare a relaţiilor cauzale în ştiinţă îi aparţin lui John Stuart Mill care
le-a publicat în celebrul său tratat „A System of Logic (1843).
Mill a intenţionat să pună la dispoziţia oamenilor de ştiinţă proceduri precise pentru
descoperirea relaţiilor de tip cauză-efect. Potrivit opiniei sale, legile cauzale enunţă o
relaţie inevitabilă între două evenimente diferite şi anume între evenimentul antecedent şi
cel consecvent, respectiv între cauză şi efect (Vadum şi Rankin, 1998). Aceste reguli sunt
de fapt strategii ingenioase pentru testarea predicţiilor prin controlul condiţiilor care
permit ipoteze rivale.
Prezentăm succint aceste metode nu doar pentru interesul lor istoric dar şi pentru faptul
că, păstrându-şi actualitatea în ştiinţa contemporană, pot prezenta cel puţin un interes
principial.
După Mill descoperirea relaţiilor cauzale între fenomene implică doi paşi succesivi şi
anume, analiza evenimentelor şi cercetarea relaţiilor cauzale.
Cercetarea relaţiilor cauzale începe prin efectuarea de observaţii mai puţin sistematizate
asupra fenomenelor care prezintă interes pentru omul de ştiinţă. În această fază nu se
intenţionează generalizarea faptelor de observaţie sau decelarea relaţiilor cauzale propriu-
zise. Are loc un proces de descompunere a fenomenelor mai complexe în componente
mai simple pentru a putea fi observate în mod eficient, proces pe care Mill l-a numit
analiza evenimntelor. Această fază a cercetării echivalează cu o anumită pregătire
mentală care îl face pe observator mai eficient şi mai inovator. Faza de analizare a
evenimentelor este încheiată în momentul în care cercetătorul poate selecţiona din
multitudinea de cauze antecedente pe aceea care condiţionează producerea fenomenelor
consecvente, respectiv a efectelor.
Dacă această fază a cercetării este incompletă sau incorect realizată pot fi omise relaţii
cauzale importante. Desfăşurarea ei cu succes implică o serie de abilităţi care pot fi
antrenate prin studiul literaturii de specialitate, respectiv prin analizarea unor cercetări
similare.
În această fază cercetătorul urmăreşte care condiţie antecedentă este urmată de o anume
condiţie consecventă sau care condiţie consecventă urmează o anumită condiţie
antecedentă. Această observare a fenomenelor în condiţii care variază este numită de Mill
varierea circumstanţelor.
Varierea circumstanţelor poate avea loc în două moduri, fie identificând variaţii care au
loc în mod natural, ca în cercetările observaţionale, fie generându-le în mod intenţionat ca
în cercetărtile numite, ulterior operei lui Mill, experimentale.
Potrivit lui Miller varierea circumstanţelor, pentru a produce rezultate credibile, trebuie
să aibă loc pe baza a patru metode: metoda diferenţelor, metoda variaţiilor concomitente,
metoda acordului (agreement), metoda rămăşiţelor, ultima având o rară aplicabilitate în
psihologie (Vadum şi Rankin, 1998). Să le trecem succint în revistă în cele ce urmează.
Se mai numeşte metoda controlului explicaţiilor rivale. Subiecţii sunt observaţi în două
momente diferite, A1 şi A2. În situaţia A1 subiecţii primesc tratamentele a1, a2, a3 iar în
situaţia A2 doar tratamentele a2 şi a3. Dacă efectul B se produce în prima condiţie atunci
el trebuie să fie cauzat de diferenţa a1 dintre cele două condiţii experimentale, pe care le
putem trata ca pe două mulţimi de elemente, adică A1-A2=a1, a2, a3-a2, a3 = a1.
Metoda diferenţelor permite un bun control al ipotezelor şi al explicaţiilor rivale. În
exemplul de mai sus explicaţiile opuse afirmaţiei că a1 este cauza fenomenului B, sunt a2
şi a3. A fost variată condiţia a1, fiind prezentă în observaţia A1 şi absentă în observaţia
A2, concomitent cu păstrarea condiţiilor a2 şi a3 constante. Acestea au fost prezente în
ambele situaţii, A1 şi A2.
Eliminarea explicaţiilor rivale a avut loc prin menţinerea constantă a condiţiilor care ar fi
putut fi folosite ca argument în favoarea explicaţiilor rivale.
Un caz special al metodei controlului explicaţiilor rivale este cel privind efectul placebo.
Unui grup de subiecţi i se administrează o substanţă activă, în timp ce grupului paralel i
se distribuie o substanţă inofensivă. Dacă grupul de control relatează aceleaşi efecte
benefice înseamnă că a avut loc efectul placebo. În unele experimente de acest fel atât
subiecţii cât şi observatorii nu cunosc, până la finele observaţiilor, care subiecţi au primit
substanţa activă şi care nu ( double blind study).
Ori de câte ori nu se poate avansa nici o ipoteză clară despre cauza posibilă a unui
fenomen metoda acordului este preferată metodelor diferenţelor şi variaţiilor
concomitente.
Un caz relatat de Vadum şi Rankin (1998) este elocvent pentru modul în care operează
această metodă. În anul 1976 o boală cu cauze necunoscute a făcut câteva victime in
Filadelfia. Cazurile au fost examinate în amănunţime cu scopul de a se decela
antecedentele comune ale maladiei aflate în atenţia responsabililor din domeniul sănătăţii.
Investigatorii au cercetat rând pe rând ocupaţiile, condiţiile generale de viaţă, contactele
posibile cu animale, agenţi patogeni, etc fără a se putea identifica printre aceşti factori
vreunul care să fie comun tuturor victimelor. Un fapt însă le-a atras atenţia: toate
victimele fuseseră oaspeţii aceluiaşi hotel. Analizele probelor de sânge recoltate de la
persoanele decedate au relevat existenţa unei bacterii numite, apoi, legionella care s-a
dovedit a fi cauza deceselor. Aceasta fusese transportată de către instalaţiile de aer
condiţionat dintr-un loc infestat în incinta hotelului.
Planul acestei cercetări ar putea fi formalizat astfel: Se cunoaşte efectul, dar nu se poate
emite o ipoteză privind cauza, care să fie comună tuturor cazurilor investigate. Se
cercetează fiecare condiţie posibilă care ar putea să fie comună tuturor cazurilor. Dacă
printre acestea una este observată la toate cazurile atunci se poate emite ipoteza că
aceasta ar putea fi cauza fenomenului cercetat. Ulterior, utilizarea metodelor diferenţelor
şi a variaţiilor concomitente poate confirma ipoteza prin respingerea explicaţiilor rivale.
Strategiile de control utilizate în psihologia experimentală pot fi clasificate în strategii
generale şi specifice.
Deşi ar fi de dorit, din păcate, aşa cum am mai menţionat, nu pot fi controlaţi toţi factorii
posibili, ci numai aceia despre care cercetătorul crede că ar putea influenţa rezultatele
cercetării, cauzele alternative cum le numesc Shaughnessy şi col. (2000). De aceea
psihologul nu trebuie să excludă posibilitatea prezenţei unor factori perturbatori a căror
acţiune nu a anticipat-o.
O serie de factori pe care am dori să-i menţinem constanţi în experiment nu îi putem
controla prin metodele obişnuite. Aceşti factori sunt reprezentaţi de caracteristicile
psihologice ale subiecţilor care participă la experiment, de diferenţele lor individuale.
Aceste diferenţe ar putea reprezenta cauze alternative şi ar afecta validitatea
experimentului.
Refacerea experimentului constituie, fără îndoială, cea mai eficientă formă de control. În
esenţă replicarea înseamnă repetarea unui experiment pentru a verifica constanţa datelor
obţinute iniţial. Prin replicare se controlează fidelitatea rezultatelor experimentale (vezi §
4.3). În general teoriile ştiinţifice se sprijină pe adevăruri care au fost replicate.
Faptele ştiinţifice care nu rezistă acestui standard sunt abandonate.
McBurney (op. cit.) menţionează entuziasmul stârnit în comunitatea ştiinţifică, în
deceniul al şaptelea al secolului trecut, de experimentele asupra transferului de memorie
la viermele planaria, prin injectarea de ţesut de la congeneri antrenaţi către cei
neantrenaţi. Nu este nevoie să discutăm consecinţele extraordinare pe care acest fapt
ştiinţific le-ar putea avea asupra condiţiei umane. După mai bine de două decenii de
replicări pe viermi sau pe şobolani, reluări soldate cu rezultate contradictorii, interesul
pentru tema în discuţie a diminuat treptat, aceasta fiind de fapt soarta tuturor cercetărilor
experimentale neconfirmate.
Există două tipuri de replicări:
Deducerea unor concluzii corecte pe baza datelor unui experiment care nu controlează
toate sursele de variaţie ar părea imposibilă. Totuşi dacă nu putem controla, eliminând
sau egalizând influenţele străine, este posibilă măsurarea erorii pe care aceste surse o
introduc în experiment?
O astfel de problemă şi-a pus matematicianul englez Sir Ronald A. Fisher. Dorind să
soluţioneze problema controlului efectului fertilizării terenurilor în agricultură, în calitate
de statistician la o staţiune de cercetări agricole, Fisher a elaborat o serie de modele
experimentale pe care le-a publicat în cartea sa din 1935 “The design of experiments”.
Dintre acestea Modelul experimental cu blocuri randomizate constituie un exemplu de
rigoare ştiinţifică privitor la controlul erorii datorate surselor de variaţie străine, altele
decât cele datorate manipulării variabilelor independente.
Redăm, pe scurt, după Vadum şi Rankin (1998) cei mai semnificativi paşi care l-au
condus pe Fisher la această importantă descoperire.
Întrucât oricât ne-am strădui să ţinem sub control toate variabilele perturbatoare într-un
experiment, întotdeuna există şansa ca experimentatorului să-i fi scăpat ceva, niciodată
nu avem certitudinea că efectele măsurate în variabila dependentă nu sunt cumva
rezultatul acţiunii şi a altor variabile decât variabila independentă. O cale de a creşte
nivelul de certitudine al rezultatelor unui experiment ştiinţific este acela de a măsura
efectul acestor influenţe perturbatoare care constituie de fapt eroarea în interpretarea
rezultatelor.
Dacă ar dori să măsoare această eroare privitoare la efectele fertilizării asupra producţiei
agricole, care este posibil să se datoreze şi altor influenţe decât fertilizării propriuzise,
cercetătorul, urmând modelul diferenţelor introduse de Mill, ar trebui să compare
producţia obţinută de pe două loturi de teren cărora, în faza de efectuare a lucrărilor de
însămânţare, li s-au aplicat două tratamente diferite, care de fapt sunt două modalităţi ale
variabilei independente: unui lot i se administrează procedura de fertilizare a terenului, pe
când celuilalt lot nu i se aplică nici un tratament. Dacă pe lotul fertilizat se obţine o
producţie mai mare, diferenţa ar putea fi atribuită acestui tratament. Dar pentru ca această
inferenţă să atingă un anumit grad de certitudine ar trebui ca experimentul să fi reluat ani
şi ani de-a rândul de către acelaşi experimentator (validare convergentă) sau de către alţi
experimentatori, pe terenuri agricole cu condiţii pedologice cât mai diferite (validare
divergentă). Geniul lui Fisher s-a dovedit în găsirea unei soluţii de a satisface condiţia
replicabilităţii experimentului de o manieră foarte comodă. El a împărţit terenul într-un
număr de blocuri egale. Fiecare bloc, la rândul lui a fost divizat în două părţi egale. Dacă
terenul ar fi împărţit în 10 blocuri, ar rezulta 20 de parcele perechi. Aplicând fertilizarea
în ficare pereche doar unei parcele, ar rezulta 10 comparaţii ale producţiei agricole, deci
ar rezulta posibilitatea replicării de 10 ori a experimentului iniţial. Totuşi alocarea
tratamentelor în fiecare pereche ar trebui efectuată la întâmplare pentru a exclude orice
influenţă datorată preferinţelor experimentatorului, sau altor deosibiri intervenite pe
durata creşterii plantelor.
Fisher a procedat la fertilizarea parcelelor în fiecare pereche prin randomizare. Iată cum,
printr-un demers ingenios, modelul experimental capătă două caracteristici esenţiale ale
controlului variabilelor, replicarea şi randomizarea.
Însumând producţia de pe cele 10 parcele fertilizate şi împărţind-o la 10 se obţine
producţia medie. Se procedează asemănător cu parcelele nefertilizate. Comparând
producţiile medii de pe cele două categorii de parcele, s-ar putea obţine o diferenţă
medie, să zicem, de o tonă, diferenţa avntajând terenul fertilizat. Dar la un astfel de
avantaj s-ar putea să fi contribuit şi alte variabile care nu au putut fi controlate, de
exemplu pe unele parcele poate au căzut cantităţi mai mari de precipitaţii. În astfel de
cazuri nu se poate decât presupune, fără să existe certitudinea, că fertilizarea este cauza
producţiei mai mari.
În limbajul ştiinţiifc de astăzi această presupunere este ipoteza ştiinţifică.
Fisher s-a gândit că, dacă nu pot fi eliminate cu totul sursele de variaţie, este oportună
calcularea erorii introduse de astfel de influenţe perturbatoare, deoarece se poate şti,
astfel, câtă încredere poate fi acordată datelor obţinute. Continuând să prezentăm
raţionamentul lui Fisher, aşa cum se va vedea, nu doar din motive de discursivitate,
anticipăm problematica metodei inferenţei statistice, care deşi va fi tratată într-o secţiune
distinctă, nu este mai puţin în substanţa ei o veritabilă metodă de a controla validitatea
concluziilor la care conduc reultatele unui experiment psihologic.
Revenind la demersul lui Fisher, acesta a presupus mai întâi că fertilizarea nu a avut nici
un efect. Această supoziţie a fost numită de Fisher ipoteza de nul. Cu alte cuvinte nu
manipularea experimentală a produs diferenţa ci întâmplarea. În aceste condiţii, logic ar fi
să evaluăm efectul factorilor întâmplători. În acest scop, fără a ţine cont de tratamentul
real, considerăm, la întâmplare, că 10 parcele, luate la întâmplare, au primit fertilizarea,
deşi este posibil ca în realitate unele sau toate să nu fi primit şi, la fel, considerăm că
celelalte 10 loturi nu au fost fertlizate, deşi este posibil ca unele sau chiar toate să fi pimit
tratamentul respectiv. Efectuând, din nou, diferenţa între cele două producţii medii se
obţine o diferenţă medie care este efectul variabilelor necontrolate, deci al întâmplării.
Reluând întraga operaţie de 500 de ori, Fisher a obţinut un eşantion tot atât de mare de
erori. Această procedură statistică se numeşte test de randomizare sau testul Monte Carlo
şi poate fi lesne realizat cu ajutorul computerului.
Era un fapt deja ştiut că, odată cu studiile lui Gauss, erorile sistematice au tendinţa de a se
distribui după curba normală, distribuţie care a fost obţinută şi reprezentată grafic de
Fisher. Să presupunem că pentru valoarea de o tonă, cât a fost diferenţa dintre cele două
tratamente experimentale, citim pe ordonata graficului o frecvenţă de 5, cu alte cuvinte
dintre cele 500 de erori medii 5 au fost mai mari sau egale cu o tonă.
Dacă fertilizarea nu a avut nici un efect, cum se afirmă în ipoteza de nul, atunci
probabilitatea de a obţine o diferenţă de o tonă între cele două categorii de parcele este p
= 5 : 500 = 0.01. Aceasta înseamnă că dacă am efectua 100 de astfel de experimente, doar
într-un singur caz variabilele necontrolate ar cauza diferenţa de producţie menţionată şi
că în 99 de cazuri aceasta s-ar datora fertilizării solului. Prin urmare întrucât p
(probabilitatea ca ipoteza de nul să fie adevărată) este doar de 0.01, este repinsă ipoteza
nulă şi se admite ipoteza de lucru, anume că sporul de productivitate s-a datorat
fertilizării.
Comunitatea ştiinţifică a adoptat propunerea lui Fisher ca pragul de semnificaţie,
respectiv punctul de la care ipoteza nulă poate fi respinsă, să fie fixat la o valoare P mai
mică sau egală cu 0.5. .α Această valoare se numeşte prag alfa şi se notează cu
În exemplul cu blocuri randomizate p< (0.01α <0.5), deci ipoteza nulă poate fi respinsă
iar diferenţa de producţie observată între cele două categorii de parcele este considerată
statistic semnificativă la un nivel de probabilitate de .01.
O variantă mult mai frecvent utilizată a testului de randomizare este testul statistic „ t
„ propus în 1908 de către William Gosset pe care acest autor l-a publicat sub
pseudonimul Student, astăzi fiind cunoscut ca metoda Fisher-Student. Vom reveni în
detaliu asupra acestei metode în § 6.9.1.1
Se impune, la sfârşitul acestor consideraţii, că modelele de control propuse de Fisher sunt
aplicabile şi aplicate în mod curent în psihologie, prin simpla înlocuire a termenilor de
bloc şi parcelă cu acelea de grup şi de subiecţi de experiment. Noţiunea de tratament
poate fi generalizată pentru a îngloba toate tipurile de condiţii experimentale sau variabile
independente care, fiind manipulate de experimentator, determină acele modificări în
comportament care sunt prezumate în ipotezele cercetării.
5.4.2 Randomizarea
Este o metodă de control, propusă de Fisher, în experimentele sale agricole, dar perfect
aplicabilă şi în psihologie, ca de altfel în oricare ştiinţă experimentală care admite că
legile sale sunt de natură statistică.
Repartizarea subiecţilor la grupuri se efectuează prin randomizare.
Randomizarea priveşte atât repartizarea subiecţilor la grupurile stabilite în planul
experimental cât şi a grupurilor la condiţiile experimentale. Randomizarea completă
presupune repartizarea pe criterii aleatoare a subiecţilor la grupuri. De exemplu, dacă sunt
prevăzute un grup experimental şi unul de control, numele subiecţilor care urmează să
intre în experiment vor putea fi introduse într-o urnă şi extrase în număr egal pentru
fiecare grup. În acelaşi mod se poate proceda pentru a repartiza cele două grupuri la cele
două condiţii experimentale (aplicarea - neaplicarea tratamentului). Logica acestui plan
experimental se bazează pe o presupunere implicită, anume că cele două grupuri sunt
similare în orice privinţă cu excepţia condiţiei experimentale la care sunt repartizate
(aplicarea–neaplicarea tratamentului). Într-adevăr randomizarea completă este destinată
tocmai egalizării grupurilor experimentale privind o serie de atribute psihice sau
demografice, altele decât variabila dependentă cum sunt: nivelul de motivare, de
inteligenţă, familiarizarea cu sarcina experimentală, numărul femeilor, nivelul instrucţiei,
etc.
În design-ul cu grupuri independente tehnica cea mai comună în controlul acestor factori
este alocarea subiecţilor prin randomizare la fiecare nivel al variabilei independente,
adică fiecărei condiţii experimentale, îi sunt repartizate grupuri diferite de subiecţi.
Shaughnessey şi col. (op. cit.) fac distincţie între repartizarea întâmplătoare (random
assignment) şi alegerea întâmplătoare (random selection). Selecţia presupune
conformarea le regulile sondajului când dintr-o populaţie bine definită se extrage
aleatoriu un eşantion reprezentativ. În foarte multe medii academice eşantioanele unor
experimente psihologice sunt mai mult sau mai puţin accidental recrutate din „populaţia”
studenţilor de la cursul introductiv de psihologie, pe criteriul voluntariatului. Această
populaţie care ea însăşi este rezultatul unei selecţii este denumită de Shaughnessy şi col.
(op. cit.) „populaţie” defectuos definită (ill-defined population). Ghilimelele au rolul de a
sugera acest fapt.
În aceste condiţii, formarea unor grupuri comparabile, care să fie asemănătoare în cele
mai multe privinţe, dar să difere tranşant prin magnitudinea efectelor produse în variabila
dependentă de către variaţiile variabilei independente, se poate realiza repartizând
aleatoriu subiecţii la grupuri independente. Când populaţia este defectuos definită, sunt
preferate planurile cu grupuri randomizate deoarece, prin desemnarea aleatoare a
subiecţilor în grupurile alocate nivelelor variabilei independente, se asigură balansarea
sau nivelarea (averaging) diferenţelor dintre subiecţii implicaţi în experiment
(Shaughnessy şi col. 2000).
Egalizarea grupurilor se efectuează ori de câte ori suspectăm că ar exista o înaltă corelaţie
între variabila egalizată şi variabila dependentă. Prin egalizare reducem la zero efectul
variabilei perturbatoare asupra variabilei dependente. Raţiunea efectului de atenuare a
variabilelor perturbatoare prin egalizarea lor rezidă în faptul, menţionat anterior, că o
variabilă poate produce efecte doar dacă este manipulată sau dacă există diferenţe dintre
nivelurile ei. De exemplu, dacă studiem efectul unei anumite metode de învăţare ar trebui
să egalizăm subiecţii din punctul de vedere al nivelului de inteligenţă deoarece este un loc
comun că există o corelaţie semnificativă între inteligenţă şi succesul în învăţare.
Variatele niveluri de inteligenţă distribuite în populaţie fac din aceasta un factor activ de
influenţare a reuşitei şcolare. De aceea este oportun ca într-o fază de pretestare să
egalizăm subiecţii d.p.d.v. al nivelului inteligenţei prin aplicarea unui test potrivit. Modul
în care subiecţii egali sunt repartizaţi la grupuri trebuie să fie bazat pe randomizare.
Shaugnessy şi col (op. cit.) propun utilizarea metodei grupurilor egalizate în situaţiile
când, din varii motive, cercetătorul trebuie să experimenteze cu un număr foarte mic de
subiecţi, care diferă între ei printr-o serie de caracteristici. Aceste diferenţe pot ele însele
să producă efecte care s-ar putea suprapune peste efectele variabilei independente
producând confuzie în interpretarea datelor experimentale. Întrucât numărul de subiecţi
este redus, este exclusă utilizarea planului cu grupuri randomizate. În unele situaţii soluţia
o reprezintă planul cu măsurători repetate (repeated mesaures design) unde aceeaşi
subiecţi parcurg toate condiţiile experimentale. Există totuşi situaţii când această metodă
nu poate fi utilizată deoarece trecerea subiecţilor de la un nivel la altul al variabilei
independente generează fenomene de transfer. De exemplu în experimentele care testează
diferite metode de învăţare sau de tratament este nevoie să se lucreze cu câte un grup
separat pentru fiecare condiţie experimentală. În astfel de situaţii cel mai indicat este
planul experimental cu grupuri egalizate (matched group plan).
Să presupunem că vrem să evaluăm eficacitatea a trei programe compensatorii în
domeniul deficitului intelectual dar nu avem disponibili decât 9 subiecţi cu niveluri
diferite de handicap. Deoarece variabila independentă (strategia compensatorie) are trei
modalităţi este necesar să utilizăm trei grupuri distincte de câte trei subiecţi. Dacă am
repartiza subiecţii prin randomizare la cele trei grupuri, numărul de subiecţi într-un grup
este prea mic pentru a fi siguri că randomizarea a uniformizat diferenţele individuale.
Prin urmare, este posibil ca diferenţele care vor fi observate între grupuri, după
parcurgerea tratamentului să se datoreze nivelelor diferite de handicap cu care
experimentul a luat startul şi nu valorii intrinseci a programelor compensatorii. Utilizând
metoda grupurilor egalizate cercetătorul va evalua prin metode psihodiagnostice adecvate
nivelul mintal al fiecărui subiect. El va putea clasifica subiecţii astfel: deficit sever (S),
deficit mediu (M), deficit uşor (U). În continuare sunt formate triplete cu acelaşi nivel de
handicap care corespund celor trei condiţii experimentale. Subiecţii cu acelaşi nivel vor fi
repartizaţi aleatoriu la fiecare program de recuperare. Este necesar să procedăm astfel
pentru a egaliza alte diferenţe individuale. Planul experimental va putea fi reprezentat
grafic astfel:
Figura 16. Plan experimental cu grupuri egalizate
Acest plan prezintă avantajul că grupurile sunt egalizate din start cu privire la nivelul de
handicap, astfel încât diferenţele constatate la finalul experimentului vor putea fi atribuite
diferenţelor de eficacitate existente între programele de recuperare parcurse de către
subiecţi.
Trebuie reţinut că design-ul cu grupuri egalizate este oportun atunci când, experimentând
cu un număr redus de subiecţi, care reprezintă cazuri rare în populaţie, este nevoie să
constituim grupuri separate şi există posibilitatea de a egaliza subiecţii din punctul de
vedere al variabilei dependente sau al unei alte variabile care corelează puternic cu
variabila dependentă (Shaugnessey şi col., op.cit).
Totuşi nu toate diferenţele individuale pot fi controlate.
Randomizarea în blocuri fiind mai riguroasă, suplineşte această carenţă.
Este una dintre cele mai utilizate proceduri de repartizare aleatoare a subiecţilor la
condiţiile experimentale.
Un bloc este format din condiţiile experimentale luate într-o ordine aleatoare. Dacă avem
patru blocuri, ordinea în care sunt date subiecţilor condiţiile experimentale este mereu
alta. Să presupunem că într-un experiment condiţiile experimentale sunt notate cu A B C
D. Ele reprezintă patru nivele ale variabilei independente (sunete foarte înalte, înalte,
joase foarte joase) care necesită patru grupuri de subiecţi. Fiind vorba de un experiment
în domeniul senzaţiilor auditive ne mulţumim cu un număr de 10 subiecţi per grup, adică
în total 40 de subiecţi.
Pentru aceasta trebuie mai întâi să realizăm zece blocuri, în care ordinea condiţiilor
experimentale să fie mereu alta. Am putea să constituim toate secvenţele posibile ale
literelor A, B, C, D. Acestea sunt 24, adică 4! (factorial)= 4 x 3 x 2 x 1 = 24. Întrucât noi
avem nevoie doar de zece blocuri, pentru a rămâne consecvenţi principiului randomizării,
va trebui să punem toate cele 24 de secvenţe (blocuri) într-o urnă şi să extragem zece
dintre ele. O procedură mai comodă şi mai elegantă este să apelăm la un tabel cu numere
randomizate, şi să alocam, fiecăruia din cele patru blocuri, cifre de la unu la patru, având
grijă să trecem peste cifrele care se repetă. Convenim de la început că A=1, B=2, C=3 şi
D=4. Să presupunem că un extras dintr-un tabel cu numere randomizate ar arăta astfel:
421954251843839223873761195284253.
Astfel de tabele pot fi create pe calculator cu ajutorul unor programe destul de simple, sau
pot fi consultate în diferite tratate de metodologia cercetării sau în tratate de statistică
pentru psihologie.
Pentru primul bloc vom alege: 4,2,1,3. Ceea ce echivalează cu seria D, B, A, C. Blocul al
doilea va avea următoarea componenţă: 2,1,4,3, adică B, A, D, C. Se procedează
asemănător pentru celelalte opt blocuri. Pentru a face mai sugestivă procedura, cifrele
„culese” din şirul randomizat au fost îngroşate.
Presupunem că subiecţilor care se înscriu, prin voluntariat, li se distribuie, în ordinea
sosirii, bonuri numerotate de la 1 la 40.
În tabelul care urmează sunt trecute cu rol exemplificativ primele două şi ultimul din cele
10 blocuri. Subiecţii S1…S40 au fost repartizaţi, pe măsura ce s-au înscris la experiment,
la fiecare din cele 40 de poziţii cât totalizează cele zece blocuri experimentale.
ACBD
BADC
CDAB
DBCA
Pentru a balansa în mod eficient efectele de ordine, pătratul latin trebuie să îndeplinească
următoarele condiţii (Shaugnessey, et.al., op. cit.):
Fiecare literă (condiţie) să apară o singură dată;•
Fiecare condiţie precede şi urmează fiecare altă condiţie o singură dată.•
Pătratul latin prezentat anterior îndeplineşte aceste condiţii, totuşi faptul că modalitatea
A, apare cu o poziţie mai spre dreapta în fiecare bloc poate să genereze o anumită
expectanţă din partea subiectului.
Shaugnessey, et.al., (op. cit.) propun următorul algoritm pentru realizarea unui pătrat latin
care elimină această deficienţă:
1. Randomizarea ordinii iniţiale a condiţiilor experimentale. O ordine randomizată a
condiţiilor A, B, C, D poate fi A, C, B, D.
2. Se numerotează ordinea randomizată de la 1 la N, unde N este egal cu numărul
nivelurilor variabilei independente. În exemplul nostru N este egal cu patru (N = 4).
Deci : A = 1, C = 2, B = 3, D = 4.
3. Se generează primul rînd al pătratului latin respectând următoarea regulă:
1, 2, N, 3, N – 1, 4, N – 2, 5, N – 3, 6, etc., ceea ce, în exemplul nostru echivalează cu
următoarea ordine : 1, 2, 4, 3, respectiv A, C, D, B.
4. Se generează al doilea rând, adăugând o unitate la fiecare număr din primul rând, cu
menţiunea că 4 + 1 = 1. Rezultă următoarea ordine 2, 3, 1, 4, adică, C, B, A, D.
5. Următoarele rânduri sunt generate după aceeaşi regulă, luând ca punct de plecare
rândul precedent. În consecinţă al treilea rând va fi 3, 4, 2, 1, respectiv, B, D, C, A.
Al patrulea rând va conţine următoarea ordine 4, 1, 3, 2, care echivalează cu: D, A, B, C.
Pătratul latin rezultat este prezentat în cele ce urmează.
ACDB
CBAD
BDCA
DABC
Când metodele de control a variabilităţii discutate până acum nu sunt suficiente este
utilizată metoda controlului statistic, mai precis, statistica inferenţială. Ea este o ramură a
statisticii pe baza căreia se iau decizii în condiţii de incertitudine. Controlul statistic este
prezent încă în faza de proiectare a experimentului, când trebuie să stabilim :
dacă avem suficienţi subiecţi;•
de câte ori vom administra condiţia experimentală;•
planul experimental permite interpretarea statistică• a
rezultatelor.
În treacăt fie spus, interesul psihologiei pentru statistica este datorat unei mari
variabilităţi a comportamentului animalelor, şi mai ales al oamenilor spre deosebire de
regnul vegetal.
Controlul statistic, într-un sens mai îngust, se referă la posibilitatea de a egaliza subiecţii,
ca să spunem aşa, „pe hârtie” atunci când acest lucru nu este posibil în sens real.
Să presupunem că două clase sunt comparate din punctul de vedere al efectului diferit pe
care îl au asupra notelor două metode distincte de predare. Diferenţele produse de cele
două metode vor interfera totuşi cu nivelurile diferite ale coeficienţilor de inteligenţă,
adică fiecare elev va profita de o metodă sau alta, funcţie de nivelul său de inteligenţă.
Controlul statistic ne dă posibilitatea prin intermediul analizei de varianţă să comparăm
cele două clase, nu pe baza notelor absolute ci pe baza diferenţelor individuale dintre nota
reală şi nota aşteptată de profesor. Această notă este derivată în mod ipotetic dacă se
cunoaşte relaţia matematică dintre notele la disciplina respectivă şi coeficienţii de
inteligenţă ai elevilor din cele două clase. Această funcţie matematică se numeşte ecuaţie
de regresie şi este o linie imaginară care uneşte pătratele abaterilor coeficienţilor de
inteligenţă de la media celor două clase. Este posibil să reprezentăm pe graficul acestei
funcţii poziţia ocupată de fiecare subiect, poziţie care se află la intersecţia valorii QI-ului
individual, reprezentat pe abscisă, cu nota obţinută de elev, reprezentată pe ordonată.
Distanţele dintre poziţiile individuale şi linia de regresie, având ca referinţă ordonata
sistemului de axe rectangulare, ne dau informaţii despre magnitudinea profitului fiecărui
elev de pe urma metodei de predare, funcţie de nivelul său de inteligenţă. Fără metoda
analizei de varianţă aceste inferenţe nu ar fi posibile.
Cook şi Campbell (1979) au teoretizat problema validităţii concluziilor bazate pe teste
statistice. Astfel validitatea acestor concluzii se confruntă cu două ameninţări respectiv cu
erorile de tip I şi de tip II. Eroarea de tip I constă respingerea ipotezei de nul când aceasta
este adevărată, ceea ce echivalează cu a confunda efectele unor surse variaţie străine cu
efectele aşteptate ale variabilei manipulate experimental.
Eroarea de tip II apare atunci când admitem ipoteza de nul deşi aceasta este falsă ceea ce
înseamnă că efecte reale ale variabilei independente nu vor fi sesizate pentru că vor fi
confundate cu efectele surselor de variaţie insuficient controlate. (vezi în § 6.6.1 puterea
testului statistic)
Cauzele acestor erori, potrivit autorilor citaţi sunt:
o puterea scăzută a controlului statistic (omiterea unor efecte slab manifeste dar
importante pentru obiectivele cercetării);
o violarea condiţiilor în baza cărora este permisă efectuarea testelor statistice (efectuarea
de teste statistice fără ca eşantionul de date să fie reprezentativ pentru populaţia de
apartenenţă sau fără să aibă o distribuţie normală);
o creşterea probabilităţii erorilor de inferenţă statistică odată cu creşterea numărului de
teste statistice;
o inconstanţa scorurilor subiecţilor la variabila dependentă datorită unor condiţii
improprii de desfăşurare a experimentului.
Pe măsură ce subiecţii trec succesiv prin toate nivelurile variabilei independente pot
apărea schimbări ale motivaţiei, atenţiei, poate surveni plictiseala sau dimpotrivă
performanţele se pot îmbunătăţi ca urmare a exerciţiului. Aceste schimbări, pe care în
mod generic Shaughnessey, et.al. (1998) le numesc efecte ale exerciţiului (practice
effects), pot furniza explicaţii complementare acelora datorate acţiunii variabilei
independente.
Acţiunea acestor efecte poate fi controlată prin tehnica balansării. În principiu această
tehnică rezidă în modificarea ordinii în care sunt prezentate condiţiile experimentale
astfel încât toate tratamentele să fie administrate într-un număr egal.
Balansarea capătă o anumită specificitate funcţie de tipul de plan cu măsurători repetate
în care se aplică.
Subiecţi
BLOCURI
1234
Florin A B C D B A C D C A B D D A B C
Andreea B C D A C D A B D A B C A C B D
Magda C D A B D A B C A C B D C B A D
Nicu D A B C A C B D B C A D C B A D
Subiecţi B L O C U R I
5678
Florin A C B D B C A D C B A D D A C B
Andreea B C A D C B A D D A C B A B D C
Magda D A C B A B D C B C D A C A D B
Nicu D A C B A B D C B C D A C A D B
Subiecţi B L O C U R I
9 10 11 12
Florin A B D C B C D A C A D B D B A C
Andreea B C D A C A D B D B A C A C D B
Magda D B A C A C D B B A D C C B D A
Nicu D B A C A C D B B A D C C B D A
Subiecţi B L O C U R I
13 14 15 16
Florin A C D B B A D C C B D A D B C A
Andreea B A D C C B D A D B C A A D C B
Magda D B C A A D C B B D C A C D B A
Nicu D B C A A D C B B D C A C D B A
Subiecţi B L O C U R I
17 18 19 20
Florin A D C B B D C A C D B A D C B A
Andreea B D C A C D B A D C B A A D B C
Magda D C B A A D B C B D A C C D A B
Nicu C B A D D B C A C D A B C A B D
Subiecţi B L O C U R I
21 22 23 24
Florin A D B C B D A C C D A B D C A B
Andreea B D A C C D A B D C A B A B D C
Magda D C A B A B D C B C D A C D A B
Nicu D C B A A D B C B D A C C D A B
5.5.1.2 Contrabalansarea
O altă modalitate mult mai simplă de atenuare a efectelor exerciţiului este tehnica
contrabalansării. Ea constă în a administra condiţiile experimentale mai întâi în
succesiunea lor normală, de exemplu AB, iar apoi în ordinea lor inversă, adică BA.
Tehnica este utilă în situaţiile experimentale unde efectele exerciţiului sunt lineare, adică
ameliorarea sau diminuarea performanţei înregistrează, de la o etapă la alta a repetării
condiţiei experimentale, o rată egală cu unitatea. Când însă odată cu trecerea de la prima
la a doua măsurătoare are loc un salt sau un regres mai mare decât în alte secvenţe ale
experimentării, cercetătorul se confruntă cu efecte nelineare iar contrabalansarea lor prin
tehnica ABBA nu mai este eficientă.
Un alt dezavantaj al acestei tehnici decurge din posibilitatea ca subiecţii să se
familiarizeze cu succesiunea stimulilor, dezvoltând expectaţii care pot modifica radical
rezultatul experimentului, astfel încât nu variabila independentă ci anticiparea stimulilor
să condiţioneze aceste rezultate.
Constă în randomizarea ordinii iniţiale a condiţiilor experimentale, aşa cum s-a procedat
în primul pas al algoritmului pentru construcţia pătratului latin. Celelalte blocuri de
condiţii sunt generate rotind ordinea randomizată prin glisarea întregului şir, cu o poziţie,
spre dreapta, astfel:
Ordinea iniţială: A, B, C, D; Ordinea randomizată: A, C, D, B;
Secvenţa I: C, D, B, A; secvenţa II: D, B, A, C; secvenţa III: B, A, C, D; secvenţa IV: A,
C, D, B.
Un principal dezavantaj al acestei tehnici este faptul că neîndeplinind condiţia a doua a
pătratului latin, unele condiţii experimentale, în mod repetat precedă sau urmează alte
condiţii ceea ce ar putea diminua balansarea efectelor exerciţiului.
Este de fapt un cvasiexperiment (vezi capitolul 7). Cook şi Campbell (op.cit.) numesc
acest tip de experiment „The one Group Posttest-Only Design”, ceea ce echivalează cu a
spune că un singur grup parcurge situaţia experimentală după care se efectuează
măsurarea modificărilor unei anumite variabile dependente.
Autorii citaţi anterior recurg la următoarea simbolistică pentru a facilita enunţurile
privitoare la acest model şi la celalte care nu au un control eficace: X semnifică
tratamentul, O semnifică observaţia, iar indicii de la 1 la n simbilizează, în cazul
tratamentelor, ordinea în care acestea sunt administrate (X1…Xn) iar pentru observaţii,
ordinea în care au fost efectuate (O1…On).
Unul dintre obiectivele majore ale experimentului ştiinţific este acela al verificării
empirice a ipotezelor deduse din teorii ştiinţifice. Ipotezele sunt explicaţii provizorii ale
unor fenomene observate sau răspunsuri date cu anticipaţie la probleme generate pe cale
deductivă de teoriile psihologice existente.
Verificarea ipotezei constituie fondul experimentării care se desfăşoară ca un proces
plurifazic implicând o serie de paşi. Există mici deosebiri în modul în care diferiţi autori
prezintă aceste etape. Deosebirile ţin mai degrabă de accentuarea unei etape sau a alteia
sau de nuanţări care sunt expresia unor preferinţe sau experienţe personale în domeniul
cercetării ştiinţifice. Este posibil ca funcţie de o serie de factori cum sunt complexitatea
problemei de cercetat, experienţa cercetătorului, mijloacele disponibile, etc., unele dintre
aceste etape să ocupe spaţii inegale în economia generală a cercetării, iar unele subetape
să fie omise în întregime.
Am putea îngloba toate fazele pe care le poate parcurge un experiment în trei mari etape:
etapa pregătitoare, etapa derulării experimentului şi etapa de valorificare a rezultatelor.
Etapa de derulare a experimentului constă în principal în controlul variabilelor, în
efectuarea observaţiilor şi în consemnarea datelor.
Deoarece problemelor complexe ale controlului le-am dedicat un întreg capitol, pentru a
evita unele repetări supărătoare pentru cititor, am evitat reluarea acestei teme în contextul
capitolului şase.
Doar cine nu a fost în situaţia de a începe un studiu sau o cercetare nu ştie câtă emoţie,
câtă încordare sunt implicate în alegerea temei, în formularea ipotezelor, în alegerea
metodologiei potrivite. Ulterior, nivelul de activare neuropsihică se autoreglează în raport
cu dificultatea problemelor. Prin urmare anxietatea şi frustrarea pe care studenţii o
încearcă în alegerea temelor pe care urmează să le trateze în referatele lor semestriale sau
în lucrările de licenţă nu este străină nici cercetătorilor experimentaţi.
Aşa cum remarcă Vadum şi Rankin (1998) tratatele de metodologia cercetării sau de
filosofia ştiinţei se preocupă de ultimele etape ale cercetării ştiinţifice privind verificarea
ipotezelor şi rareori se apleacă asupra travaliului implicat în identificarea problemelor de
cercetat şi în elaborarea ipotezelor. Fazele incipiente ale cercetării sunt de obicei
explicate prin apelul la o serie de procese iraţionale (inspiraţie creativă, noroc) care de
fapt joacă un rol minor în creativitatea ştiinţifică. Mai degrabă procesele logice şi
raţionale, implicate în viaţa de zi cu zi, sunt cele care de fapt concură la rezolvarea
problemelor ştiinţifice. Una din caracteristicile de bază ale oamenilor de ştiinţă este
curiozitatea intensă faţă de problemele specifice domeniului lor de specializare. Ea
susţine desfăşurarea unei munci de durată, care cere efort, dăruire şi perseverenţă mai
ales când rezultatele aşteptate întârzie să apară.
Abordarea corectă, încă din faza iniţială, a unei probleme de cercetat aduce în actualitate
pregătirea teoretică anterioară consolidată pe durata şcolarităţii şi alimentată continuu de
educaţia permanentă. Sesizarea unei probleme care merită să fie cercetată este posibilă pe
un teren de solidă cunoaştere a domeniului respectiv. De fapt sesizarea unui fenomen a
cărui cercetare poate să sporească nivelul cunoaşterii este posibilă pe un fond larg şi bine
structurat de cunoştinţe. A observa nu înseamnă doar a detecta un fenomen ci şi a-l
recunoaşte şi interpreta prin operaţiile de clasificare şi categorializare, posibile tocmai
graţie unor informaţii solide în domeniul cercetat. Receptivitatea cercetătorului faţă de
aspecte care scapă de obicei observatorului comun este una enculturată, educată şi
antrenată.
Vadum şi Rankin, (op. cit.) consideră că abilitatea de sesiza corect o problemă de cercetat
poate fi stimulată de o serie de condiţii:
În general sursa de inspiraţie pentru noile idei în ştiinţă sunt fie problemele puse de
societate fie problemele personale. Vadum şi Rankin (op.cit.), citând o serie de autori,
consideră că nouă din zece (cercetători nn) sunt social sau personal implicaţi în temele pe
care le studiază.
Un alt autor, D Schultz (1990) consideră că dezvoltarea unei anumite teorii a
personalităţii este motivată de anumite evenimente din biografia teoreticianului respectiv.
Identificarea unui domeniu de interes în cercetare este urmat de îngustarea acestuia prin
focalizarea pe o întrebare care este testabilă privitor la relaţia care ar putea exista între
variabilele luate în considerare. Cu alte cuvinte este necesar ca ipoteza să fie cât mai
precis formulată şi să vizeze o relaţie cât mai specifică între variabile, aceasta fiind o
garanţie că planul experimental va fi îndeajuns de simplu pentru a permite o verificare
riguroasă a ipotezei de lucru.
Uneori alegerea problemei, care poate ulterior să angajeze munca de o viaţă, are loc
aleator prin observarea întâmplătoare a unui fapt semnificativ sau prin sesizarea unor
implicaţii sau lacune ale unei lucrări ştiinţifice.
consultarea bibliografiei prezentată la finalul unor cărţi şi manuale care acoperă o vastă
arie problematică;•
consultarea unor instrumente de documentare. Psychological Abstracts• (Rezumate de
psihologie, buletin editat de A.P.A. (Asociaţia Americană de Psihologie) conţine
rezumate ale articolelor din prestigioase reviste de psihologie, rezumate clasificate pe
tematici. Conţine referinţe despre articole şi cărţi, precum şi sursele bibliografice care le-
au citat. În felul acesta este posibil ca alegând un subiect să refacem „istoria” unei idei,
modul cum aceasta a evoluat. Se poate începe cu oricare articol şi se poate vedea dacă
acesta este citat apoi de către altcineva, şi dacă articolul care l-a citat este ulterior
comentat de alţi autori şi tot aşa mai departe; Social Science Citation Index (Indexul
citărilor dinştiinţele sociale). Acest instrument suplineşte o carenţă a revistei
Psychological Abstracts, anume ne dă posibilitatea să urmărim modul în care comunitatea
ştiinţifică a tratat o anumită temă, fără să rătăcim prin articole care nu prezintă relevanţă
pentru tema care ne interesează.
În citirea unui articol trebuie mai întâi să ne focalizăm pe rezumatul introductiv (Abstact)
pentru a afla care sunt principalele poziţii teoretice, problemele controversate şi ce soluţii
au fost propuse.
De asemenea, este important să ştim care probleme sunt nerezolvate pentru că acestea pot
constitui aria în care să ne desfăşurăm propriile experimente. În continuare ne interesăm
de rezultatele şi concluziile articolului, urmând ca apoi să intrăm în detaliile cercetării
propriu-zise. Este important ca înainte de a aprofunda articolul să avem o imagine de
ansamblu asupra problemei pe care acesta se focalizează şi de asemenea asupra modului
în care această problemă a fost soluţionată sau asupra modului în care autorul a încercat
să o soluţioneze.
Parcurgerea conţinutului articolului ne ajută să sesizăm unele imperfecţiuni legate de
metodă sau omiterea unor importante aspecte. Este important să procedăm la o preluare
critică, plină de discernământ a ideilor şi concluziilor articolului pentru a ne contura,
astfel, un punct de vedere original.
6.2 Alegerea metodei şi a procedurilor
În SUA există Institutul Buros, înfiinţat în 1939 de către Oscar Buros, institut care se
ocupă cu furnizarea de informaţii despre instrumentele de măsurare şi evaluare
psihologică. El editează încă de la înfiinţarea sa „Anuarul instrumentelor de măsurare
mentală” (The Mental Mesurements Yearbook), căruia ulterior i s-a adăugat un supliment
„The Suppliment of the Mintal Mesurements Yearbook cu apariţie bianuală. Adresa pe
Internet a acestui institut este (WWW.unl.edu/buros).
Alegerea subiecţilor este dictată de două considerente de bază. Primul ţine de faptul că
unele experimente dictează ele însele ca procedurile să nu poată fi aplicate decât pe
animale. De asemenea pentru a face rezultatele comparabile nu este bine să se apeleze la
alte feluri de subiecţi decât cei care au fost utilizaţi în experimente care constituie puncte
de referinţă în domeniu. De asemenea, chiar în cazul experimentelor pe animale
schimbarea speciei ridică serioase probleme legate de întreţinerea lor. Al doilea
considerent este legat de costurile pe care le implică plata subiecţilor umani, motiv care
explică de ce studenţii de la psihologie sunt cel mai adesea preferaţi ca subiecţi. În S.U.A.
studenţii din anul al doilea (sophomores) primesc credite suplimentare dacă participă la
experimente psihologice.
Jersey Neyman şi Egon Pearson (citaţi de Vadum şi Rankin, 1998) au introdus noţiunea
de putere a testului statistic prin care au înţeles probabilitatea unui plan experimental de a
conduce la concluzii corecte. Puterea unui plan experimental depinde simultan de
numărul subiecţilor incluşi în grupul experimental şi în cel de control, de mărimea
efectelor produse de variabila independentă asupra variabilelor comportamentale, de
abaterea standard a efectelor, etc.
În analiza unui plan experimental se ţine seama de două caracteristici: sensibilitatea
experimentului şi puterea testului statistic.
Sensibilitatea semnifică probabilitatea ca un experiment să detecteze efectele variabilei
independente dacă acestea într-adevăr există.
Puterea este caracteristica unui test statistic de a respinge ipoteza de nul atunci când
acesta este într-adevăr falsă. Ea se defineşte în relaţie cu eroarea de tip II despre care am
spus, în § 5.4.5, că înseamnă incapacitatea de a respinge ipoteza de nul atunci când
aceasta este falsă. Aceasta înseamnă că puterea este inversul erorii de tip II. Ea este
notată fie în procente fie ca număr zecimal. Această relaţie poate fi exprimată matematic
astfel:
Planurile cu măsurători repetate sunt mai sensibile şi permit teste statistice mai puternice
decât planurile cu grupuri independente, deoarece au erori de variaţie mai mici (Variaţiile
intraindivid sunt mai mici decât deosebirile între indivizi).
Puterea unui test statistic este condiţionată de trei factori care interacţionează între ei:
nivelul semnificaţiei statistice, mărimea efectelor variabilei independente şi mărimea
eşantionului. Mărimea eşantionului este factorul cel mai la îndemâna experimentatorului
pentru a controla puterea testului statistic. În acelaşi timp, aşa cum vom vedea mai
departe, mărimea eşantionului poate fi stabilită plecând de la anumite exigenţe privind
puterea testului statistic.
În general se optează pentru o putere a testului statistic de peste 80%. Într-un plan
experimental riguros realizat, sensibil, pot fi sesizate cele mai mici efecte ale variabilei
independente care în condiţii experimentale mai puţin riguroase ar putea rămâne
neobservate.
În proiectarea unui experiment ar trebui să plecăm de la o anumită estimare a mărimii
efectelor produse de variabila independentă asupra variabilei dependente. Acest lucru
este posibil consultând datele publicate despre experimente efectuate în domeniul care ne
interesează sau efectuând un studiu pilot. Ambele procedee ne oferă doi parametri de care
avem absolută nevoie, diferenţa medie şi abaterea standard. Mărimea efectului, respectiv
magnitudinea diferenţei între grupul experimental şi cel de control, notată cu d, se poate
calcula cu formula d = Md – As, unde: Md este media diferenţelor observate iar As este
abaterea standard (Vadum şi Rankin, 1998). Această metodă poartă numele de media
standardizată a diferenţelor sau metoda Cohen.
Shaugnessey et. al. (op. cit.) consideră că aşa-zisa analiză de putere a unui experiment
trebuie efectuată încă din faza de proiectare a planului. În acest scop autorii propun
următorul algoritm cu doi paşi:
o Estimarea mărimii efectelor variabilei independente pe baza consultării rezultatelor
unor experimente în care a fost implementată variabila care ne interesează. Este vorba de
a anticipa dacă efectele variabilei manipulate experimental vor fi greu sesizabile (efecte
mici), mediu sau uşor detectabile (efecte de mărime mare).
o Alegerea din tabele de putere a mărimii eşantionului necesară detectării efectelor
estimate.
6.6.2 Mărimea eşantionului funcţie de mărimea efectelor
McBurney (op. cit.) tratează problema stabilirii numărului de subiecţi care să fie cuprinşi
în experiment în relaţie cu eroarea standard a măsurătorii. În formula următoare este
eroarea standard a mediei, iar este abaterea standard a măsurătorilor variabilei
dependente.
1. Întotdeauna
2. Uneori
3. Rareori
Întrebările cu răspuns deschis sunt utile fie atunci când există mult prea multe variante de
răspuns, fie ca un stadiu incipient al construirii unei scheme de răspuns, când se
inventariază repertoriul răspunsurilor posibile la o anumită categorie de subiecţi.
Întrebările cu răspuns deschis prezintă avantajul obţinerii unor informaţii foarte variate
dar şi dezavantajul că implică serioase dificultăţi de cuantificare în vederea evidenţierii
anumitor modele comportamentale sau atitudinale la subiecţii investigaţi.
În general forma răspunsurilor închise poate să varieze de la un chestionar la altul.
Funcţie de obiectivele urmărite în cercetare formatul răspunsurilor poate cuprinde
răspunsuri exhaustive de tipul „DA – NU”, „Acord-Dezacord” etc. Creşterea preciziei
măsurătorii poate fi realizată dacă se utilizează diferite scări de evaluare. Acestea pot
varia funcţie de criteriul general de evaluare care poate fi criteriul frecvenţei
comportamentului (vezi mai sus), criteriul importanţei (foarte mică, medie, mare, foarte
mare), criteriul probabilităţii (foarte limitată, limitată, moderată, mare, foarte mare, etc).
Scările de evaluare pot fi diferite în privinţa numărului de gradaţii care pot fi de trei,
cinci, şapte, nouă. Sunt preferate numerele impare deoarece permit o reprezentare mai
exactă a mijlocului scării unde se situează valorile medii. În cazul chestionarelor mai
elaborate, gradaţiilor de pe scară li se ataşează descripţii sau ancore care permit o
evaluare mai fină de către persoanele fără antrenament în utilizarea acestor instrumente
de evaluare.
Dintre întrebările cu răspuns închis se detaşează cele cu alegere forţată. Acestea
controlează foarte eficace tendinţele subiecţilor de falsificare a răspunsurilor.
În multe situaţii, când sunt cercetate aspecte delicate cum sunt cele privind consumul de
droguri sau comportamentele antisociale, obţinerea cooperării subiectului implică măsuri
speciale pentru asigurarea de o manieră, „vizibilă” pentru subiect, a confidenţialităţii
răspunsurilor la chestionar. Un tip de chestionar care are astfel de facilităţi a fost realizat
de Stanley Warner în 1965 (Vadum şi Rankin, 1998). El este prevăzut cu un sistem de
răspuns care permite păstrarea secretului dat de fiecare subiect dar permite calculul
procentului de subiecţi dintr-un lot care au dat un anumit tip de răspuns.
6.8 Pretestarea
Este metoda cea mai larg utilizată pentru a evalua rezultatele experimentelor al căror plan
cuprinde grupuri independente, alocate prin randomizare la diferitele niveluri ale
variabilei independente. Statisticile descriptive nu ne dau prin ele însele posibilitatea de a
decide dacă modificările observate în comportamentul subiecţilor de experiment sunt sau
nu sunt rezultatul manipulării variabilei independente. Această imposibilitate este
determinată de faptul că peste efectele variabilei independente se poate suprapune
acţiunea unor variabile care ţin de diferenţele existente între subiecţi. Este adevărat că
randomizarea, ca metodă de repartizare a subiecţilor la grupuri şi a grupurilor la condiţiile
experimentale, egalizează în bună parte aceste diferenţe, dar efectul ei este focalizat mai
ales pe deosebirile dintre grupuri, cu scopul de a le face comparabile.
Validitatea internă a experimentului, aşa cum am văzut anterior (4.1.1), este condiţionată
de eliminarea surselor de variaţie străine şi a explicaţiilor alternative, care le sunt
asociate, cu privire la faptele experimentale observate. Cauzele alternative (sursele străine
de variaţie) se referă aici la diferenţele care se mai menţin între grupurile experimentale
comparate în pofida faptului că repartiţia subiecţilor la aceste grupuri a avut loc prin
randomizare tocmai pentru a aplatiza aceste diferenţe. În interiorul grupurilor rămân
destule diferenţe între subiecţi care produc aşa zisele variaţii nesistematice, subsumate
denumirii generice de eroare de variaţie.
Datorită erorii de variaţie este posibil ca diferenţe existente între mediile grupurilor
experimentale să nu se datoreze variabilei independente ci diferenţelor dintre indivizi în
cadrul fiecărui grup şi mai ales între grupuri.
Cea mai utilizată metodă de inferenţă a unor concluzii plecând de la eşantioane de date
este aceea a ipotezei de nul.
Testul ipotezei de nul ne ajută să decidem dacă efectele observate într-un experiment se
datorează variabilei independente sau erorii de variaţie. Acest test statistic presupune ca
subiecţii celor două grupuri comparate au fost extraşi prin randomizare dintr-o populaţie
mult mai numeroasă. Totuşi, Fisher, referindu-se la această metodă, consideră că testul t
aproximează foarte bine testul de randomizare chiar atunci când grupurile comparate nu
sunt extrase dintr-o populaţie foarte largă (Vadum şi Rankin, 1998).
Testul ipotezei de nul presupune următorii paşi:
Testul ipotezei de nul nu furnizează certitudini ci doar probabilităţi care înclină, fie în
sprijinul ipotezei ştiinţifice, fie în sprijinul ipotezei de nul. Sunt considerate ca fiind
semnificative statistic acele rezultate experimentale care întrunesc o probabilitate de
minim 95% de a fi cauzate de variabila independentă, sau o probabilitate de 5% ca
ipoteza de nul să fie adevărată. Nivelul de probabilitate ales de cercetător la care ipoteza
de nul poate fi respinsă se numeşte nivel sau prag de semnificaţie. Din motive lesne de
înţeles nivelul de semnificaţie trebuie fixat înainte de începerea cercetării (Shaugnessey,
1998). Altfel, apare tentaţia de a alege acest nivel astfel încât ipoteza ştiinţifică să fie
confirmată cu orice preţ.
În mod curent pragul de semnificaţie de 5% este interpretat astfel: Dintr-o sută de
replicări ale experimentului nostru, vom avea dreptate în 95 de cazuri şi ne vom înşela în
cinci dintre ele dacă vom afirma că schimbările în variabila dependentă sunt cauzate de
variabila independentă.
Totuşi, această metodă de inferenţă statistică testează adevărul sau falsitatea ipotezei de
nul şi nu a ipotezei ştiinţifice care este testată de experimentul însuşi. De aceea ar fi mai
nimerit, aşa cum vom vedea mai departe, ca interpretarea testului să fie efectuată în
termenii ipotezei de nul, după cum urmează: dintr-o 100 de testări ale ipotezei de nul, în
cinci dintre ele este posibil să se producă faptele experimentale aşteptate, chiar dacă
ipoteza de nul ar fi adevărată.
Într-o formă plastică am putea spune că fiecare efect aşteptat care se produce este o
palmă pe obrazul ipotezei de nul. Ea nu poate suporta fără să fie compromisă mai mult de
cinci palme, ceea ce echivalează cu pragul de semnificaţie.
Este posibil să greşim uneori faţă de biata ipoteză de nul şi să o pălmuim deşi spune
adevărul, anume că efectele observate nu sunt cauzate de variabila independentă. Deci
pragul de semnificaţie exprimă probabilitatea de a comite o eroare de tip I, adică de a
respinge ipoteza de nul în condiţiile în care aceasta este adevărată. (Reamintim că eroarea
de tip I apare atunci când ipoteza de nul este respinsă deşi aceasta este adevărată. Ea este
controlată prin testul ipotezei de nul.)
Am putea să reducem tipul I de eroare alegând un prag de semnificaţie cu mult mai mic,
de exemplu, acceptând că dintr-o mie de teste ale ipotezei de nul doar în unul dintre ele
variabila independentă ar produce efectele scontate chiar dacă ipoteza de nul este
adevărată. Totuşi, o restrângere atât de mare a pragului de semnificaţie poate creşte riscul
ca cercetătorul să comită eroarea de tip II. (Reamintim că eroarea de tip II constă în
admiterea ipotezei de nul când aceasta este falsă. Ea este controlată printr-un plan
experimental care asigură controlul sever al variabilelor şi replicarea experimentului, fapt
care facilitează depistarea efectelor reale ale variabilei independente. Cu cât experimentul
este mai corect proiectat cu atât forţa concluziilor sale va fi mai mare.
Se poate observa că există un adevărat cerc vicios privitor la cele două tipuri de erori.
Restrângerea probabilităţii uneia dintre ele creşte şansele de producere ale celeilalte.
Această stare de aparent relativism, proprie ştiinţei moderne, nu înseamnă decât că
certitudinile în ştiinţă sunt statistice iar psihologia nu face excepţie de la această regulă.
Aşa cum, judicios constată Shaugnessey et.al (op. cit. p. 248), acesta este motivul unei
anumite prudenţe specifică concluziilor unor cercetări bazate pe inferenţa statistică.
Astfel, cercetătorii „rareori utilizează cuvântul dovedesc când descriu rezultatele unui
experiment care a implicat statisticile inferenţiale. În schimb ei descriu rezultatele ca
fiind consistente cu ipotezele, confirmând sau suportând ipotezele.”
Am văzut că testul semnificaţiei ipotezei de nul (numit şi testul „t”) este susceptibil de
două abordări diferite. Ele sunt posibile deoarece producerea unui eveniment poate fi
estimată în termenii teoriei probabilităţii din două perspective: ca o probabilitate „p”,
numită nivel de semnificaţie, (Comunitatea ştiinţifică acceptă un p mai mic sau egal cu
5%) de a avea loc sau ca o probabilitate „q” de a nu se produce, unde: p = 100% - q.
Astfel, putem afirma că un efect este posibil în 100-q % din cazuri şi/sau nu este posibilă
în 100-p % din cazuri (cazurile se referă la situaţiile în care testul ipotezei de nul ar fi
repetat de 100 de ori, în aceleaşi condiţii).
Am putea vorbi de o interpretare de tip clasic, potrivit căreia ipoteza de nul afirmă ca
rezultatele experimentului (de exemplu diferenţa între mediile grupurilor comparate) sunt
nesemnificative, acestea datorându-se întâmplării sau erorilor de eşantionare, testul „t”
conducându-ne la adevărul sau falsitatea ipotezei de nul. Prin respingerea acesteia
confirmăm ipoteza ştiinţifică în care se afirmă că efectele observate în variabila
dependentă sunt cauzate de variabila independentă.
J. Cohen (1995), J. Shaugnessey et. al (op. cit.) avansează o perspectivă oarecum diferită
a testului ipotezei de nul, dezvoltând consecinţele logice ale definiţiei de pe celălalt
versant al interpretării. Autorii citaţi anterior consideră că, întrucât testul ipotezei de nul
pleacă de la premisa că ipoteza de nul este adevărată (Variabila independentă nu produce
nici un efect asupra variabilei dependente) logic este să considerăm că el determină
probabilitatea ca diferenţele înregistrate cu privire la variabila dependentă să fie
semnificative, dacă ipoteza de nul este adevărată. Dacă această probabilitate este mică
ipoteza de nul este respinsă şi se conchide că efectul variabilei independente este unul
semnificativ statistic. „Cheia înţelegerii testului ipotezei de nul – subliniază J.
Shagnessey et. al (op. cit., p. 246) – este înţelegerea faptului că utilizăm legile
probabilităţii pentru a estima probabilitatea unui rezultat numai atunci când plecăm de la
supoziţia că factorii întâmplători constituie singura cauză a acelui rezultat „ … „Un
rezultat statistic semnificativ este acela care are doar o mică probabilitate de a se produce
dacă ipoteza de nul este adevărată”.
Următorul exemplu va face mai intuitivă deosebirea dintre aceste două puncte de vedere.
Să presupunem că în urma derulării unui anumit experiment şi a statisticilor aferente, un
anumit rezultat are o probabilitate de p = .02. Potrivit interpretării clasice există 98 %
şanse ca ipoteza ştiinţifică să fie confirmată de rezultatul obţinut şi 2 % şanse ca ipoteza
nulă să fie adevărată.
Potrivit interpretării propuse de J. Shaugnessey et. al (op. cit.) există doar 2 % şanse să
existe un efect semnificativ statistic al variabilei independente, în forma rezultatului
obţinut, în condiţiile în care, de fapt, ipoteza nulă fiind adevărată, nu există nici un efect
real al variabilei independente asupra variabilei dependente.
Din această perspectivă autorii identifică patru posibile erori în interpretarea testului
ipotezei de nul:
1. Confuzia dintre semnificaţia statistică a unui rezultat şi valoarea sa practică şi
interpretativă. Un rezultat experimental poate să fie semnificativ statistic fără să aibă
neapărat o semnificaţie psihologică. Acest fapt este posibil deoarece semnificaţia
statistică este dependentă de mărimea eşantionului. De exemplu o diferenţă între
preferinţele bărbaţilor (media = 5.5) şi ale femeilor (media =5.6), observată într-un
experiment cu două grupuri randomizate, care au cuprins 1000 de femei şi, respectiv
1000 de bărbaţi, poate să fie semnificativă statistic la un nivel de semnificaţie de .01, dar
fără valoare practică, deci fără să ne poate conduce la o concluzie pertinentă. Un fapt
experimental care este semnificativ statistic, dobândeşte valoare interpretativă din punct
de vedere psihologic dacă are o anumită magnitudine, care poate fi evaluată prin metoda
estimării mărimii efectelor, care va fi discutată în subcapitolul consacrat analizei de
varianţă.
2. Concluzionarea nejustificată că un experiment are validitate internă numai pentru că a
produs rezultate semnificative din punct de vedere statistic. Autorii atrag atenţia că există
nenumărate cazuri când experimente cu o slabă validitate internă, caracterizate prin
confuzia dintre efectele variabilei independente şi ale variabilelor străine, au dat rezultate
semnificative statistic. Aceste rezultate nu pot fi interpretate în lipsa calităţii validităţii
interne care elimină riscul confuziei şi al explicaţiilor alternative.
3. Înţelegerea eronată a testului ipotezei de nul ca o modalitate de a determina
probabilitatea ca ipoteza de nul să fie adevărată, confuzie conţinută în concluzii de acest
tip:” Probabilitatea de obţinere a acestor rezultate doar ca urmare a întâmplării este mai
mică decât .05.” (J. Shaugnessey et. al op. cit., p. 250).
Formularea este eronată, argumentează autorii citaţi, deoarece testul ipotezei nul nu
estimează probabilitatea ipotezei de nul de a fi adevărată, întrucât întreaga procedură se
bizuie pe presupunerea că ipoteza de nul este adevărată.
Dimpotrivă, testul în cauză estimează cât de probabil este rezultatul experimentului dacă
ipoteza de nul este adevărată. Dacă această probabilitate este mai mică de .05 atunci
ipoteza de nul este respinsă. De aceea, conchid autorii citaţi, formularea corectă a
concluziei ar putea fi următoarea: „Rezultatele se vor produce cu o probabilitate mai mică
de .05 presupunând că ipoteza de nul este adevărată” J. Shaugnessey et. al op. cit., p.
250).
Interpretarea eronată a probabilităţii unui rezultat experimental ca o expresie a
repetabilităţii efective a acelui rezultat dacă experimentul va fi replicat. Revenind la
exemplul anterior, probabilitatea de p = .02 nu este un indiciu că faptul experimental va fi
obţinut în 99 de cazuri dacă experimentul va fi repetat de 100 de ori. Dimpotrivă, singura
cale de a fi siguri că un rezultat va fi repetat este aceea de a replica experimentul însuşi.
Confruntaţi cu atâtea posibile capcane ale metodei inferenţei statistice studenţii şi tinerii
cercetători ar putea încerca un anumit sentiment deconcertant. Totuşi ei au suficiente
motive să fie încrezători când vor să generalizeze rezultatele experimentelor pe care le
întreprind. Testul semnificaţiei ipotezei de nul (NHST – null hypothesis significance
testing) poate fi completat cu o serie de tehnici de analiză, ca de exemplu analiza datelor
exprimate grafic, analiza intervalelor de încredere, estimarea mărimii efectelor cauzate de
variabila independentă asupra variabilei dependente, prin care se poate ajunge la un nivel
acceptabil de încredere în rezultatele experimentale obţinute.
Cohen (1995, p. 1002) după o critică pertinentă a limitelor testului semnificaţiei ipotezei
de nul, formulează următoarea concluzie încurajatoare: „ … Dispunem de un ansamblu
de tehnici statistice, care, utilizate inteligent, pot să uşureze eforturile noastre. Dar, dat
fiind dificultăţile inducţiei statistice, trebuie să ne bizuim în cele din urmă, aşa cum au
procedat cercetătorii din trecut, pe repetarea experimentelor”.
De asemenea, calea esenţială rămâne perfecţionarea sau stăpânirea atât a teoriilor care
explică faptele ştiinţifice abordate experimental, cât şi a tehnicilor de măsurare, fapt care
permite formularea unor ipoteze cât mai testabile şi creşterea validităţii interne a
experimentelor.
Metoda ipotezei de nul, care testează dacă diferenţele înregistrate în variabila dependentă
pot fi atribuite variaţiilor provocate în variabila independentă, are o serie de
inconveniente care au fost semnalate de o serie de autori (Cohen, 1995, Loftus, 1996,
Radu, 1992).
Nu este de mirare că cercetătorii îşi orientează atenţia şi spre alte metode de a efectua
inferenţe riguroase pornind de la colecţii de date obţinute prin eşantionare.
Intervalele de încredere sunt utilizate pentru compararea grupurilor implicate în
experiment.
Un interval de încredere este o estimare a limitelor în care se va situa media populaţiei pe
baza mediei eşantionului, a erorii standard a mediei şi a pragului de probabilitate acceptat
de experimentator (Shaughnessey et. al., op. cit) .
Înţelesul noţiunii de interval de încredere este corelat cu acela al termenului de margine
de eroare.
Marginea de eroare reprezintă estimarea diferenţei dintre o măsurătoare obţinută pe un
eşantion şi valoarea adevărată care este proprie populaţiei din care eşantionul a fost extras
prin tehnica studiilor de sondaj. Marginea de eroare arată cât de bine aproximează
rezultatele unui sondaj caracteristicile adevărate ale unei populaţii. Ea este determinată de
mărimea eşantionului şi de nivelul de încredere (pragul de probabilitate acceptat de către
cercetător). Cu cât eşantionul este mai mare, deci cu cât şansele ca tot mai multe
caracteristici ale populaţiei să se regăsească în eşantion sunt mai mari, cu atât marginile
de eroare sunt mai apropiate. Amintim că nivelul minim acceptat de comunitatea
ştiinţifică este de 95 %, ceea ce înseamnă că se admite că din 100 de estimări 5 dintre ele
să fie eronate. Este un fapt curent că întotdeauna există diferenţe între valorile adevărate
care s-ar obţine dacă o măsurătoare ar viza întreaga populaţie şi rezultatele care decurg
din consultarea unui anumit eşantion. Diferenţele sunt determinate de o serie de factori
întâmplători, cum este cazul erorii de eşantionare, pe care randomizarea îi poate limita
dar nu îi poate elimina în totalitate. A stabili marginile de eroare ale unei măsurători
echivalează cu indicarea limitelor în care, cu o probabilitate de eroare de cel mult 5%, ar
putea să se situeze valoarea adevărată a unei anumite caracteristici a populaţiei.
Iată un exemplu: Să presupunem că cercetarea preferinţelor pentru băuturi răcoritoare,
efectuată pe un eşantion reprezentativ din populaţia elevilor de liceu constată că o
anumită marcă este preferată de 55 % dintre persoanele intervievate, cu un prag de
probabilitate de 5 %. Aceasta înseamnă că procentajul adevărat, care ar rezulta dacă
studiu ar fi efectuat pe întreaga populaţie ţintă, s-ar situa între 55 plus/minus 5, adică între
50 şi 60 %.
O estimare mai riguroasă a limitelor probabile în care se situează mărimea unei
caracteristici a populaţiei ţintă se realizează prin metoda intervalelor de încredere,
deoarece, pe lângă pragul de probabilitate se ia în calcul şi eroarea standard a mediei.
Intervalul de încredere se determină cu formula:
CI =
Unde:
CI- interval de încredere (confidence interval)
X – media
MSerror - eroarea standard a mediei
t crit – valoarea lui t pentru un anumit prag de probabilitate (nivel de încredere) şi pentru
un anumit număr de grade de libertate df (degree of freedom).
Vom trata separat analiza de varianţă funcţie de tipul de model experimental, (a) cu
grupuri independnente şi (b) cu măsurători repetate.
F==
Potrivit ipotezei de nul nu există nici o variaţie sistematică între grupuri, respectiv
variabila independentă nu produce nici un efect. Consecinţa logică este aceea că, dacă
ipoteza de nul este adevărată valoarea lui F va fi egală cu unitatea, iar dacă este falsă
raportul va fi supraunitar. Egalitatea numărătorului cu aceea a numitorului, pentru cazul
când ipoteza nulă este adevărată, este doar una ipotetică, deoarece, cel mai adesea,
estimarea erorii de variaţie între grupuri este mai mare decât aceea intragrupuri, acest fapt
datorându-se factorilor întâmplători. Valoarea lui F trebuie să fie suficient de mare astfel
încât, potrivit logicii exprimării lui Shaughnnesey (Shaughnnesey, et. al. op. cit.), dacă
ipoteza de nul este adevărată, probabilitatea lui F să fie mai mică de .05., ceea ce
echivalează cu afirmaţia: Valoarea lui F trebuie să fie suficient de mare astfel încât,
nivelul de probabilitate la care efectul variabilei independente este real să fie de peste 95
%. În aceste situaţii ipoteza de nul este considerată falsă şi se admite ipoteza ştiinţifică,
anume că variaţia variabilei independente de-a lungul condiţiilor experimentale a
determinat o modificare semnificativă din punct de vedere statistic asupra variabilei
dependente, deci a avut un anumit efect.
Amintim că pragurile de probabilitate sunt luate din tabelele Fisher-Student, pe baza
gradelor de libertate şi a valorii lui F. Atunci când testele de inferenţă statistică sunt
efectuate pe computer, programul matematic furnizează un tabel rezumativ, care, printre
altele, prezintă pragul de probabilitate la care valoarea calculată a lui F este statistic
semnificativă.
Iată, în continuare, un tabel în care sunt rezumate rezultatele unui experiment întreprins
de Asch în deceniul şase al secolului trecut în domeniul presiunii spre conformitatea de
grup.
Asch a fost interesat de două aspecte ale acestui fenomen: mai întâi dacă este reală
conformitatea de grup iar în al doilea rând dacă această conformitate creşte odată cu
mărimea grupului.
Surse de variaţie df SS MS F P
Variaţia între grupuri 6 198.98 33.16 27.2 .0001
Variaţia intragrup 63 77.13 1.22
Varianţa totată 69 276.11
Tabelul rezumativ prezentat anterior conţine rezultatele acestor calcule. Se poate observa
că F are o valoare de 27.2 care este semnificativă pentru un prag de probabilitate de .
0001.
Prin urmare se poate conchide că manipularea variabilei independente de-a lungul celor
şapte nivele a produs un efect statistic semnificativ, ceea ce echivalează cu respingerea
ipotezei de nul potrivit căreia nu a existat nici un efect în afară de acela datorat
întâmplării.
Deşi programul pe computer efectuează toate statisticile descriptive şi inferenţiale, este
instructiv, pentru oricine se interesează de aceste probleme, să parcurgem succint paşii
logici ai efectuării testului F.
a) Determinarea numărătorului raportului F. El este varianţa existentă între grupuri.
Această variaţie cuprinde indistinct atât eroarea de variaţie datorată diferenţelor dintre
subiecţi, diferenţe care nu au putut fi eliminate în totalitate prin randomizare ci doar
egalizate plus variaţia sistematică produsă de manipularea variabilei independente. În
tabelul rezumativ valoarea lui MS de 33.16 exprimă la un loc aceste două tipuri de
varianţă. Se observă că acest număr este trecut pe linia varianţei intergrupuri. El a fost
obţinut împărţind valoarea lui SS, de pe aceeaşi linie, la numărul corespunzător al
gradelor de libertate (degree of freedom - df). În principiu, numărul gradelor de libertate
este dat de diminuarea cu o unitate a numărului indivizilor sau condiţiilor luate în
considerare. În acest caz df = numărul grupurilor – 1 = 7-1 =6.
b) Determinarea numitorului. El este reprezentat de valoarea lui MS din tabel, care, pe
linia corespunzătoare variaţiei intragrup este de 1.22. În adevăr cea mai semnificativă
sursă de variaţie, alta decât variaţia sistematică a variabilei independente care este
aşteptată de experimentator, este aceea dată de deosebirile dintre subiecţii aceluiaşi grup.
În orice experiment creşterea validităţii interne conduce la minimizarea variabilităţii
intragrup şi la maximizarea variabilităţii intergrupuri. Valoarea lui MS de 1.22 a fost
obţinută împărţind valoarea lui SS de 77.13 la numărul gradelor de libertate, adică la 63.
Gradele de libertate sunt, în acest caz, rezultatul înmulţirii numărului de grupuri cu
numărul gradelor de libertate din fiecare grup. Într-un grup fiind 10 subiecţi, df = 10 – 1
= 9. Deci, 7 x 9 = 63.
c) Calculul raportului şi interpretarea lui F.
Deci F =
(2) Analiza detaliată a surselor sistematice de variaţie
Dacă analiza de tip omnibus confirmă că existenţa unui efect al variabilei independente,
în continuare se justifică efectuarea unor comparaţii mai sistematice.
Paşii care trebuie întreprinşi sunt similari celor din analiza omnibus. Experimentatorul
trebuie să răspundă la două întrebări:
a) Există diferenţe privind numărul de erori în situaţia experimentală în care subiectul
este singur şi situaţia când subiectul rezolvă sarcina experimentală în grup?;
b) Are loc o creştere a numărului de erori pe măsură ce creşte mărimea grupului?.
Pentru aceasta vor fi efectuate comparaţii între mediile performanţelor pe diferite
combinaţii ale nivelurilor variabilei independente, astfel: I / (II + III + IV + V + VI + VII)
sau I + II / III + IV + V + VI + VII) sau I + II + III / IV + V + VII.
Performanţele individuale la fiecare stimul au fost exprimate prin mediana celor şase
scoruri. Pentru un număr mic de măsurători, efectuate pe un singur subiect media, fiind
neconcludentă deoarece este influenţată de eventualele scoruri extreme, este înlocuită cu
mediana, aceasta reprezentând o modalitate mai adecvată de a rezuma statistic
performanţa fiecărui subiect.
Următorul pas constă în a condensa performanţele individuale sub forma mediilor, pe
fiecare condiţie experimentală, deoarece verificarea ipotezei, că subiecţii pot diferenţia
intervalele de timp considerate, presupune controlul statistic al semnificaţiei diferenţelor
între mediile calculate la nivelul fiecărui interval de timp. Aceste medii sunt date în
tabelul anterior.
Programe speciale, realizate pe computer, efectuează atât statisticile descriptive cât şi
cele inferenţiale implicate în analiza de varianţă, şi le fac vizibile pe monitor sau la
imprimantă în forma unor tabele rezumative.
F=
Eroarea de variaţie se calculează, scăzând din varianţa totală varianţa produsă de celelalte
două surse de variaţie, respectiv subiecţii şi variabila independentă, adică lungimea
intervalelor de timp.
2 =η = .80
unde:
s=
Se ştie că, în orice comparaţie statistică mărimea efectului este cu atât mai mare cu cât
varianţa intragrup este mai mică iar varianţa intergrup este mai mare.
Semnificaţia psihologic-experimentală a acestui fapt este următoarea: Cu cât eroarea de
variaţie, datorată diferenţelor individuale dintre subiecţi, este mai mică, cu atât
omogenitatea grupurilor este mai mare. Randomizarea, prin alocarea subiecţilor la
grupurile comparate, şi a grupurilor la condiţiile experimentale, este utilizată în acest
scop fără ca aceasta să elimine complet eroarea de variaţie. Măsura aceste variaţii
intragrup o constituie dispersia. Pe de altă parte efectele cauzate de variabila
independentă asupra variabilei dependente sunt cu atât mai mari cu cât grupurile alocate
nivelurilor variabilei experimentale contrastează puternic în privinţa tratamentelor
aplicate şi sunt foarte asemănătoare în toate celelalte privinţe (eroare de variaţie mică).
Măsura contrastului dintre grupurile comparate o constituie abaterea standard.
Acum, se vede clar în formula coeficientului d că, pentru o aceeaşi diferenţă între medii
(numărătorul), cu cât variabilitatea intragrup este mai mică (numitorul) cu atât mărimea
efectului variabilei independente este mai mare.
Cohen (op. cit.) a clasificat coeficientul d în trei categorii: mic (.20), mediu (egal cu .50)
şi mare (.80) ceea ce echivalează cu trei niveluri ale magnitudinii efectului variabilei
independente.
Acest coeficient completează o serie de insuficienţe ale inferenţei statistice, în special
aceea cauzată de faptul că, pentru un efect slab, doar simpla creştere a mărimii grupurilor
comparate, îl poate face statistic semnificativ, fără însă a reprezenta un fapt ştiinţific real
şi util în verificarea sau în construcţia unei teorii ştiinţifice. Semnificaţia dobândită astfel
rămâne doar rezultatul jocului întâmplării.
Din perspectiva acestei noi proceduri apare clar cât de amăgitoare este inferenţa statistică,
dacă semnificaţia statistică a unui rezultat (diferenţă între medii, corelaţie, grupare de
factori, etc) nu este verificată prin alte tehnici cum sunt cele deja trecute în revistă în
subcapitolul precedent: analiza graficelor, marginea de eroare, intervalele de încredere,
coeficientul lui Cohen, etc.
Aşa cum remarcă Shaughnessey et. al. (op. cit.) principala dificultate a planului bazat pe
grupuri naturale este aceea de a îndeplini condiţia numărul trei, eliminarea cauzelor
alternative. Această condiţie asigură validitatea internă a unui experiment şi este posibilă
doar printr-un riguros control al variabilelor, caracteristică proprie cercetătorului care
intervine activ în experiment şi mai puţin proprie, dacă nu chiar absentă, în cazul naturii.
Principala sursă de eroare a cvasiexperimentelor este că, cercetătorul nu are nici un
control asupra variabilelor invocate. De exemplu variabila sex utilizată într-un
qvasiexperiment. Efectele sale asupra variabilei dependente pot fi uşor confundate cu
efectele altor variabile străine, cum sunt cele care ţin de influenţele mediului social şi
care dau conţinut sex-rolurilor. Acestea sunt variabile cu potenţial de confundare
Mc.Burney (op. cit) ce permit explicaţii alternative ale efectelor studiate.
Figura 21 prezintă cele trei etape parcurse de cercetare, respectiv măsurarea SN înainte de
voiaj, evoluţia comportamentului nevrotic pe durata voiajului, şi etapa de revenire
datorată întreruperii cursei (tratamentului).
Revenirea criteriilor comportamentale măsurate la valorile pretest constituie un indiciu
înalt probabil al unei legături între comportamentele nevrotice şi condiţiile specifice
voiajului.
b) Plan experimental cu repetarea tratamentului
Este un plan experimental care presupune reluarea condiţiei experimentale în scopul
îmbunătăţiri validităţii interne a experimentului. Este un plan utilizat în experienţele cu
un singur subiect.
Graficul teoretic al unui astfel de experiment, având pe abscisă datele calendaristice ale
testării iar pe ordonată performanţele la testare, ar trebui să prezinte tendinţe similare
între prima şi a doua testare şi între a treia şi a patra, când a fost aplicată condiţia
experimentală. În intervalul dintre a doua şi a treia testare când tratamentul a fost
întrerupt ar trebui ca tendinţa să fie contrară tendinţelor dintre cele două perechi, 1-2 şi 3-
4, tocmai pentru că nu a fost aplicată condiţia experimentală.
Unele experimente efectuate pe un singur subiect mai sunt numite şi studii de caz.
Modelul experimental comun acestor experimente a fost numit de Campbell şi Stanley,
1963) « design OXO ». « O » semnifică observaţiile efectuate înainte şi după tratamentul
notat cu X., termenul de observaţie fiind o denumire generică pentru măsurătorile care se
efectuează înainte şi după parcurgerea de către subiect a condiţiei experimentale.
Deşi prezintă o serie de avantaje, comparativ cu planurile experimentale care implică mai
mulţi subiecţi, modelul experimental aflat în discuţie este astăzi mai puţin utilizat
deoarece el este relevant doar dacă tratamentul determină efecte imediate şi de o
magnitudine care le fac neîndoielnice, evidente prin ele însele. Ori, marea majoritate a
efectelor observate în experimentele psihologice au nevoie să fie confirmate statistic,
datorită amplitudinii lor scăzute.
Există totuşi situaţii când modelul experimental cu un singur subiect este de neînlocuit.
În acest sens evocăm un experiment (citat de Vadum şi Rankin, op.cit.) întreprins de
Howard Shane în 1990 pentru verificarea autenticităţii rezultatelor unei metode care
părea să revoluţioneze comunicarea cu persoanele autiste. Este vorba de aşazisa
comunicare facilitată, procedeu prin care mâna copilului autist era ajutată de facilitator
pentru a tasta la computer gândurile sale.
Această metodă intrase în atenţia Curţii judecătoreşti din New England deoarece, prin
intermediul unei astfel de metode, o fetiţă dintr-o şcoală specială dezvăluise profesorului
său că fusese abuzată sexual de unii membrii ai familiei. Problema care se punea era dacă
nu cumva informaţia fusese supraadăugată de către facilitator, bineînţeles nu în mod voit.
Această metodă (model ABA) este menită să îmbunătăţească planul precedent, în sensul
că introduce o condiţie suplimentară în vederea creşterii gradului de certitudine că
schimbările comportamentale sunt în adevăr efectul manipulării condiţiei experimentale.
Astfel, la fel ca în exemplul precedent, se determină tendinţa constantă a subiectului
privitoare la variabila dependentă pe care urmează să o modificăm printr-o anumită
manipulare experimentală. Urmează apoi tratamentul experimental. În momentul în care
avem suficiente dovezi despre modificări reale ale comportamentului, pentru a le atribui
cu mai multă certitudine manipulării condiţiei experimentale, tratamentul se întrerupe
temporar. Dacă schimbările la nivelul variabilei dependente se datorează tratamentului
însuşi, atunci comportamentul ar trebui să evolueze după tendinţa anterioară
tratamentului.
Deontologia profesională obligă experimentatorii să continue ameliorarea condiţiei
subiectului prin reluarea tratamentului până la dovada unei tendinţe constante
posttratament. În aceste condiţii putem vorbi de un alt model experimental care va fi
prezentat în continuare.
Repetarea tratamentului după faza de întrerupere are două consecinţe pozitive, una pentru
subiect, care la sfârşitul experimentului are o condiţie mai bună, alta pentru validitatea
internă a experimentului pentru că permite evaluarea efectelor produse de tratament. Este
un model de tip ABAB .
McBurney (op. cit.) evocă un interesant experiment întreprins de Edward Carr şi Jack
McDowell în 1980.
Un băiat de 10 ani contractase într-o anumită împrejurare o dermatită în urma căreia
rămăsese cu obiceiul de a se scărpina până işi producea răni. Cei doi cercetători au
observat copilul în situaţii variate şi au emis ipoteza că, întrucât scărpinatul, aproape
întotdeauna, se declanşa în contexte sociale, acesta funcţiona ca un răspuns operant prin
care copilul câştiga atenţia părinţilor.
În prima parte a experimentului, conform instructajului, părinţii au ignorat scărpinatul
copilului. Faza aceasta nu a putut dura mai mult de trei zile deoarece problema copilului
trebuia rezolvată urgent. În a doua fază, a atenţiei sociale, părinţii îi tot repetau copilului
să termine cu scărpinatul. În etapa finală părinţii au ignorat din nou gesturile copilului.
Autorii au sintetizat rezultatele în două grafice. În primul grafic cele două curbe ale
atenţiei sociale şi ale frecvenţei scărpinatului coincid foarte mult, aceasta fiind o
confirmare a ipotezei că scărpinatul era declanşat de atenţia pe care părinţii o dădeau
acestui comportament. Etapele de ignorare (deci de întrerupere a tratamentului
experimental) au înregistrastrat scăderi dramatice ale scărpinatului şi au contribuit la
creşterea nivelului de certitudine a acestei tendinţe. Într-un al doilea grafic autorii au
prezentat pe abscisă perioadele calendaristice ale experimentului care a durat din iunie
1976 până în iunie 1978. Pe ordonată au prezentat numărul de zgârieturi ca un indicator
al frecvenţei comportamentului incriminat.
Figura 19. Fazele experimentului întreprins de
Edward Carr şi Jack McDowell
Prima fază, aceea a stabilirii unei tendinţe constante, prezintă un nivel al zgârieturilor
care nu va mai fi atins în nici o fază a experimentului.
În faza a doua a tratamentului frecvenţa zgârieturilor scade foarte dramatic. Următoarea
fază, de întrerupere a tratamentului, prezintă o revenire la tendinţa de bază. Ultima fază a
tratamentului a continuat să reducă frecvenţa scărpinatului până la aproape de extincţie.
În faza ulterioară a experimentului s-a obţinut stingerea totală a cestui comportament.
În experimentele bazate pe un singur subiect dar în care sunt manipulate cel puţin două
variabile independente este nevoie să se diferenţieze momentele când se acţionează
asupra uneia sau alteia deoarece manipularea lor simultană face imposibilă diferenţierea
efectelor lor. Mai precis, cercetătorul trebuie să ştie dacă modificările în variabila
dependentă, adică în comportamentul subiectului, sunt rezultatul uneia sau alteia dintre
variabile sau reprezintă rezultatul interacţiunii lor. Păstrând şi în acest plan faza de
stabilire a tendinţei de referinţă care precede acţiunea variabilelor independente,
experimentatorul poate alege, din mulţimea secvenţelor posibile a acestei faze conţinând
manipularea separată a fiecărei variabile independente şi a ambelor deodată, acea
succesiune care serveşte cel mai bine scopul experimentului. Acest design este
echivalentul modelului factorial care este utilizat în experimentele pe grupuri de subiecţi
şi poate avea forma A-B-A-B-BC-B-BC, unde A este tendinţa de bază a variabilei
dependente înainte de experiment iar B şi C sunt cele două variabile independente.
9.1.4 Confidenţialitatea
Ideea de libertate faţă de coerciţie este strâns legată de aceea a dreptului la intimitate ca
unul dintre drepturile fundamentale ale omului. Această idee a câştigat tot mai mult teren
în ultimul secol.
Preocupat să respecte dreptul la intimitate al subiecţilor săi, cercetătorul se confruntă cu
imperativul de a acorda cel puţin tot atâta importanţă intereselor societăţii care pot evolua
într-un sens opus, acela de a acumula în scop de autoreglare cunoştinţe care pot fi
obţinute tocmai prin violarea intimităţii indivizilor săi.
Claritatea înţelegerii între cercetător şi participanţii la experimentul său este esenţială şi
constituie pentru el o preocupare constantă. Acesta trebuie să respecte toate obligaţiile
asumate prevăzute în contract.
Cercetătorul trebuie să ia toate măsurile pentru a împiedica prejudicierea fizică sau
mentală a persoanelor care participă la experiment. El trebuie să îi informeze dacă există
riscul vreunui prejudiciu şi să obţină consensul înainte de a începe experimentul. Dacă
experimentul implică riscuri majore acesta va fi evitat. Totuşi, majoritatea situaţiilor
experimentale implică un anumit stress datorită caracterului lor de noutate pentru subiect.
Cercetătorul are obligaţia de a lua toate măsurile pentru diminuarea acestuia.
Debriefing-ul reprezintă deconspirarea de către experimentator a scopului adevărat al
experimentului în vederea creşterii gradului de informare al subiecţilor si al împiedicării
producerii oicărui prejudiciu, ca urmare a mascării scopului adevărat al cercetării.
Debriefing-ul este folosit de către cercetător pentru a evalua gradul de mascare a sensului
rezultatelor experimentale. Unii subiecţi pot accepta cu greu că au fost înşelaţi şi ca
urmare pot adopta rolul de “subiecti buni”.
Pe de alta parte ei pot conştientiza într-un grad diferit mascarea intenţiilor cercetării
datorită modului în care sunt chestionaţi. Mult mai multe şanse sunt ca subiectul să
conştientizeze mai bine mascarea scopului cercetării dacă nu este întrebat direct dacă are
ceva de întrebat ci dacă este invitat să evoce ce anume i s-a părut fals în explicaţiile
preliminare date de experimentator cu privire la adevăratul scop al experimentului.
La finalul experimentului discuţia finală cu subiectul ţinteşte următoarele scopuri:
Obţinerea unor informaţii preţioase despre modul în care a intuit scopul experimentului
pentru a evalua corect influenţele efectelor exercitate de caracteristicile solicitate :