You are on page 1of 11
4. ESANTIONAREA IN CERCETAREA SOCIALA 4.1. Definirea esantiondrii Prin esantionare se urmiareste realizarea unei cercetari reprezentative prin studierea numai a unei parti din universul cercetarii, care alcdtuieste 0 colectie statistic de unititi (elemente). fn domeniul social, egantionarea intervine in cercetiri realizate prin anchet de tipul sondajelor de opinie publica, de marketing, de audienta, de consum etc., dar si in studiul documentelor sociale, ca gi in diverse alte cercetéri (de exemplu, se determina’ numarul de vizite necesare in observatia instantanee). Esantionarea consti in extragerea, in condifii specificate, a unui numar de unitati statistice din universul cercetarii. In consecinta, esantionul este un model la scar mica al universului cercet&rii, Datele obfinute din studierea egantionului (statistica ,,s”) pot fi extinse la nivelul colectivitatii totale (parametru »P”), cu anumite limite de variatie, la un nivel de probabilitate (precizie) stabilit. Esantionarea se bazeaza pe doua teorii statistice : legea numerelor mari si calculul probabilitatilor. Legea numerelor mari (Bernoulli, Poisson) fundamenteazi marimea esantionului (n), iar calculul probabilititilor reglementeaza selectia subiectilor in esantion. Referindu-ne Ja reprezentativitate, vom avea in vedere ci aceasta este dependent’ de marimea esantionului si de schema de esantionare utilizati, Reprezentativitatea (eficienta) este cu ataét mai bund cu cat avem de-a face cu erori de esantionare mai mici. Scopurile cercetirilor selective sunt acelea de estimare a parametrilor (media, proportia).ce caracterizeaza o anumith caracteristicd a populatiei si de testare a unor ipoteze statistice despre populatie (C.A. Moser, Metode de ancheté in investigarea fenomenelor sociale, 1967). in cele ce ! la PROIECTAREA CERCETARI SOCIOLOGICE urmeaza, nu ne propunem si inlocuim tratarea esantionarii din manualele de statistic. Sociologul accentueazi aspectele legate de proiectarea esantionului gi culegerea datelor. Statisticianul este preocupat mai mult timari gi informajii. Colaborarea dintre cele dou specialitati (si specialisti) este absolut necesari, La intrebarea cat de mare uebuie si fie un esantion, raspunsul este doar orientativ, de tipul : ,Suficient de mare pentru a putea fi reprezen- lativ", Teoretic, s-a stabilit ci marimea esantionului este invers propor- fional cu patratul erorii de esantionare, Altfel formulat, eroarea de esantionare este invers proportional cu ridiicina patrat din mirimea esantionului. Pentru a reduce eroarea la jumitate, trebuie si creasci de patru ori volumul esantionului. Calcularea mirimii esantionului presu- pune cunoasterea caracteristicilor distribujiei variabilelor colectiviti(ii totale, considerate criterii de esantionare. La o colectivitate relativ omogeni, mirimea cerut pentru esantion va fi mai mic& decat la o colectivitate mai eterogend, 1a un nivel, dorit de reprezentativitate. La randul su, probabilitatea exprima nivelul la care se fac estimarile de la esantion la colectivitatea totali, iar eroarea de esantionare defineste spatiul de variatie a valorilor estimate, respectiv eroarea standard a medici sau a procentului (proportiei). in practica cercetirilor sociologice s-a convenit ci nivelul proba- Dilitafii cu care se fac estimirile sX nu fie mai mic de 0,95, dar, evident, poate si se apropie cat mai mult de 1. Este cunoscut faptul ci nivelurile de probabilitate se dispun pe spatiul 0-1. Cat priveste valoarea |, ca are sens aici doar cénd se studiaza intreaga populatie, cind de fapt estimarea nu mai este necesari. Un nivel de probabilitate de 0,95 ne ‘gurdi c& valoarea estimati pentru colectivitatea total’ se situeazit in spajiul de variayie in 95 de cazuri din 100 de esantioane (in 19 cazuri din 20). Se utilizeazai $i notiunea de prag de incredere ~ in acest caz, el este de 0,05. Posibilitatea erorii este de 5 cazuri din 100 esantioane (sau 1 caz din 20). Daci am lucra cu o probabilitate de 0,99, atunci nivelul de precizie al valorilor estimate pentru aceeasi marime a esantionului devine mai mare, dar spatiul de variatie (eroarea) creste. Cat priveste eroarea de eslimare.a valorilor esantionului, aceasta este acceptati pe intervalul de E§ANTIONAREA IN CERCETAREA SOCIALA 13 la + 1% pind Ja + 5%. Prin urmare, o valoare determinati la nivel de esantion si estimati in populatia totala ia valoarea cuprinsé in spatiul delimitat de valoarea de esantion ++ eroarea de estimare pentru 0 pro- babilitate dati. Astfel, o valoare relativa de 50%, cat ar reprezenta popularitatea unui partid, de exemplu, conduce la o valoare estimata in colectivitate situata in spatiul 49-51% ; pentru o eroare de 1%, spatiul de estimare devine 45-55%, pentru o eroare de 5%. De aici rezulti céteva elemente de orientare a egantionarii 1, Pentru a obfine rezultate acceptabile, nu este necesar si studiem intreaga colectivitate, dact aceasta este relativ mare. La colecti- vititile mici, esantionarea este neavenita. {n acest ultim caz trebuie si se studieze intreaga populatie sau loturi ale populatiei. 2. Mirimea esantionului nu se determini ca proportie din colectivi- tatea total. in fapt, acest raport poate fi egal cu 1 (chiar mai mare decat 1 atunci c&nd universul cercettirii este foarte mic) sau poate lua valori extrem de mici, de ordinul a milionimea parte. Mirimea colectivitatii totale este Iuat% in considerare Ia constituirea unui coeficient pentru corecfia finita, cu care se reduce marimea esantio- nului atunci cand acesta reprezint mai mult de 10% din populatia totali (C.A. Moser, op. cit.). Cand acest raport scade, coeficientul de corectie se apropie de 1 si nu mai conteazi. O corectie a mirimii esantionului se realizeaz si atunci cénd selectia este fara inlocuire (nerepetata), ceea ce este cazul aproape general in cerce- tarea social. $i aici se obfine ins tot o reducere nesemnificativi a esantionului; dar, asa cum vom vedea, cercetiirile sufera din cauza unor esantioane prea mici. Mai important decat corectia mirimii esantionului este determinarea exactii a erorii de esantionare. 3. Riscurile de eroare sunt importante, avand in vedere ci se studiaza un singur esantion, comparativ cu numérul practic inabordabil de mare ce s-ar putea constitui pentru colectivitasile mari. Un exemplu ne poate edifica: la 0 colectivitate de 15 milioane persoane sunt posibile 10,000 de esantioane de céte 1.500 persoane, fara nici 0 persoani comund, si 10.000 ta puterea 1.500 esantioane daca se 144 PROIECTAREA CERCETARII SOCIOLOGICE accept intrarea oricarei persoane in mai multe esantioane. in primul caz, pentru 0 probabilitate de 0,95, rezulti c& in 9.500 de esantioane din 10.000 este de asteptat ca valoarea estimatt si fie in limita spatiului de variagie, iar in 500 de cazuri si fie in afari, Eroarea de esantionare exprimd variatia de la un esantion la altul. Media valorilor medii pentru toate esantioanele ne di valoarea medic a variabilei in populatia totala (parametru). Studiindu-se un esantion firi inlocuire (0 unitate o dati selectati nu se mai intro- duce in colectia statistica), la determinarea erorii standard de estimare a parametrilor ar trebui si se utilizeze, de asemenea, factori de corectie. Altfel, in cazul inferenjelor poate si apari eroare'de tipul II, adici si se accepte ipoteza nuli, a lipsei de diferent semnificativa dintre douk medii sau dou’ procente ~ Mm, = Mp, P =P; -, desi cele dou’ medii (procente) comparate pot fi diferite, ca urmare a faptului c& eroarea standard este calculati la un nivel mai mare gi deci si spatiul de variatie acceptat este mai mare. fn acest fel, diferentele mai mici, dar semnificative, sunt ignorate. De exemplu, o diferen(t de 0,2 intre dou’ medi comparate sau de 2 puncte procentuale intre dowd procente si fie tratate ca nesemnificative, deoarece utilizand o valoare necorectati a erorii standard, rezultt o diferent’ teoretic semnificativa de 0,25 (2,5 puncte procentuale) pentru un nivel de probabilitate de 0,95. Celilalt risc, eroarea de tipul I, ar fi respingerea ipotezei nule si acceptarea ipotezei existentei diferenfei, m, #m,, p, # Py, desi ea nu este semnificativa. Acest fapt se produce si cind se uutilizeazi pragul de incredere mai putin riguros (p = 0,95). Spori- rea nivelului de rigurozitate, p > 0,99, poate atrage insi reaparigia erorii de tipul If (C.A. Moser, Metode de anchetd in investigarea Jenomenelor sociale, 1967). Cu toate acestea, se pot obtine estimiri acceptabile ale valorilor in colectivitatea total cu un singur esantion, Probleme mai dificile le ridicd studiile de predictie a unei evolutii viitoare (anchetele pre- electorale, de exemplu). Aici este recomandabil si se lucreze cu un nivel inalt de probabilitate (de 1a 0,99 in sus) si cu eroare mica (sub 3%), ceea ce inseamn’ egantioane relativ mari. ESANTIONAREA IN CERCETAREA SOCIALA 15 4.2. Marimea esantionului Determinarea mirimii optime a esantionului se realizeaz’i printr-un proces de analiza, in care intr, pe ling’ elementele statistice, costurile gi alte aspecte legate de posibilititile de care se dispune Ia un moment dat, De cele mai multe ori nu se cunosc valorile variabilelor pentru colect vitatea total, iar valorile de esantionare sunt cunoscute dupa efectuarea cercetirii. Din acest motiv, mirimea esantionului este abordatd la nivel teoretic, fficdnd anumite ipoteze in legituri cu valorile variabilelor. Procedind intr-o manierd normativi, mérimea optima a unui esantion se stabileste prin luarea in considerare a valorilor adecvate ale nivelurilor probabilitiii cu care se face estimarea si a mirimii erorilor de estimare. Formulele teoretice de determinare a mirimii unui esantion sunt valabile pentru esantionare simpla aleatorie si sunt diferite pentru variabi- lele cantitative, respectiv variabilele calitative (atribute) : a) variabilele cantitative, cind se poate calcula media (m) si abaterea standard a mediei (0) : n= €xo7/e b) variabile calitative (atribute), sau ori de cite ori valoarea variabilei se exprima in procente (respectiv in proportii) : = P P(100 - P) /e' P pl - p)/ unde tes ce corespunde nivelului de probabilitate, Ba se determin’ din proprietatea repartitiei normale (Gauss), mirimea suprafetei delimitati simetric Ia dreapta si la sténga mediei prin unititi de abatere standard, La t = 1 se acoperii 68% din cazuri (deci 0 proportie si, totodat, 0 probabilitate de 0,68), Unei pro- babilitati de 0,95 fi corespunde t = 1,96 ; la P = 0,99, t = 2,56; la P = 0,999, t = 3,3 (vezi tabelul cu suprafetele sub curba normal), iar o° este varianta mediei, o este abaterea standard, o = JX &-m)'/n incolectivitatea totali. Pentru a sublinia 146 PROIECTAREA CERCETARI SOCIOLOGICE c& este vorba de un esantion, adesea se foloseste simbolul s pentru abaterea standard; ¢ este eroarea de estimare a valorii medii, respectiv a unui procent sau proportie (se mai numeste eroare standard sau eroare de esantionare) ; P este probabilitatea, iar 100 - P complementul lui P; p este proportia, iar 1 - p com- plementul lui p. Valoarea minima teoretic’ a lui n ar rezulta daca se iau in consi- derare valoarea maxima acceptati pentru eroare (+ 5%) si pragul minim de probabilitate (0,95), pentru estimarea valorii de minim 5 puncte procentuale, si ednd n ar fi de 76 persoane. De observ: insd c& estimarea valorii de 5 procente din esantion, pentru colecti- vitatea total, se situeaz in intervalul 0-10% (5% +: 5%). Valoarea optima a mirimii esantionului se determin in functie de atingerea unor obiective specifice, la costuri abordabile. a) Pentru cercetiiri descriptive (probabilitate minima, eroare teore~ tict si dispersie maxime). Daci: 1) P = 50% 2-2 3)e = 5% Rezulti: n = 400 ) Pentru cercetiri care presupun analize corelationale pe céteva subesantioane (cu reducerea mirimii erorii teoretice).. Dac&; 1) P = 50% Dr=2 3)e=3% Rezulti: n= 1.083 Este mirimea egantionului cel mai des utilizat in Romania si nu rnumai, in studiile de marketing, de opinie public’ etc, Marimea respectivi este totusi prea mic’ pentru analizele cu variabile care au mai multe diviziuni, pe grupuri multiple etc. ©) Dac& se doreste reprezentativitate pe multe subgrupuri, méri- mea esantionului trebuie si crease in mod considerabil. Tot astfel si in cazul efectuarii de predictii. ESANTIONAREA IN CERCETAREA SOCIALA, c,. Reprezentativitate cu probabilitate si eroare de mirime medie. Dack: 1) P = 50% 2) t= 2,56 3) e = 2% Rezult: n= 4.093 c,. Reprezentativitate cu asigurare doar a erorii teoretice de mirime medie. Dac: 1) P = 50% He? 3)e = 2% Rezulti: n= 2.500 ‘Totodati intervin si alfi factori legati de imprastierea teritoriala, mirimea mic a unor straturi de populatie pe care le vrem reprezentate ete. Esantioanele mai mari sunt necesare si pentru faptul cX in cercetirile nafionale are loc 0 indepirtare de la cerinjele esan- tionarii simplu aleatorie, pentru care sunt valabile formulele teoretice enuntate. ) Valoarea lui n sporeste substantial la nivelul mediu de proba- bilitate si eroare teoretic’ minima. Daci: 1) P = 50% 2) t = 2,56 3)e= 1% Rezulti: n = 16.384 Solutie de urmat in situafii foarte fine de predictic. ©) Cand se ia in considerare si un nivel foarte inalt pentru t, nereste pe misura. Daca: 1) P = 50% 2) t = 5 (Probabilitatea = 0,99999) 3)e=1% Rezulti: nm = 125.000 ur ry PROIECTAREA CERCETARI! SOCIOLOGICE Pentru situatiile obignuite, acest numar pare o exagerare, dar sunt cercetiri care necesiti astfel de esantioane. Raportat ta populayia adult a Rominiei, el nu reprezinti decit 0,7% Costurile ar fi mult mai mici decat pentru un recensimant, {ntr-un mod asemiinitor se tucreaza pentru variabilele cantita- tive, in condijiile necunoasterii valorilor variabilelor in colecti- vitatea totald, se fac si aici anumite supozitii. De exemplu, se poate presupune c& abaterea standard (a) are o anumit valoare relativa fafi de medie (consideratt 1), Pentru o = 0,5, miirimea esantionului este similark cazului d, prezentat anterior Dac&: 1) ¢ = 05-1 2) t = 2 (Probabilitatea = 0,95) 3) e = 2% = 0,02) Rezulti: n = 2.500 Ipotezele asupra abaterii standard sunt mai dificil de stabilit, existind riscul atat al construirii de esantioane cu reprezentativitate slab& (erori de esantioane de peste 5% Ja nivelul minim de probabilitate), cat si al unor esantioane exagerat de mari, fra o crestere substantiald a eficientei, dar cu costuri inalte de realizare. 4.3. Eroarea de esantionare in momentul proiectitii esantionului, se stabileste nivelul dorit al erorii de estimare a valorilor populatiei totale pe intervalul 1-5%. De avut in vedere faptul ci, in studiile de predictie, aceasti valoare trebuie si fic de maxim 3, de dorit 2 sau chiar 1, iar estimarea se face cu o probabilitate de 0,97, 0,98, 0,99 si mai mare. Rationamentul proiectirii esantionului incepe cu analiza de estimare a erorii de egantionare ce ar rezulta la 0 anumit m&rime a lui n. P10 N- tYPORED corectat 0; = 1 JUMP) Now ESANTIONAREA IN CERCETAREA SOCIALA Si urmiirim un asemenca demers de incercare si eroare. Presupa- nem c& am studiat 10 persoane in legitur cu optiunea lor politich (Practica intélnitt in documentarea jurnalistict), Am gisit c& 2 persoane sunt adepte ale partidului A, 4 sunt adepte ale partidutui B, iar 4 nu prefer nici un partid. Se pune problema si estimim Popularitatea partidelor. Mai intdi am vrea si stim care este pro- Portia, in populafia din care fac parte cele 10 persoane, a celor care opteazii pentru un partid sau altul. 1) p= 06 2Qt=2 3 n= 10 0,31 Pe baza acestui ,,rezultat”, putem spune cif audienta partidelor se situeazi in spatiul 0,6- 0,31 si 0,6 + 0,31, cvea ce este total nesatisficitor ca nivel de cunoastere: audienja partidelor este undeva pe spatiul 29-91 % si aceasta doar in 95 de cazuri din 100 esantioane, iar in S$ cazuri parametrul estimat poate fi in afara acestui spatiu imens. Acelasi rezultat al erorii standard poate fi folosit pentru a estima Proportia celor care nu au afiliere poli in acest caz, am spune c& proportia in populatie a celor neafiliati politic esie undeva pe spatiul de 0,4-0,31 si 0,4 + 0,31 (adicd intre 9% si 71%! Lucrurile se complica si mai mult (daca se mai accept o continuare a demonstratiei). Rezulté c& intre 29 gi 91% au afilicre politica, dar intre 9 si 71% nu au astfel de afiliere. Similar, s-ar putea cuta despre popularitatea partidului B: eroarea standard ar duce Ja un parametru in populatie situat pe spayiul 0-0,4 (de la 0% 1a 40%). Si mai nostim este faptul ci, in cazul expus, pentru Partidul A”, eroarea este superioar’ populaititi inregistrate, Singura concluzie ce s-ar putea trage studiind cele 10 persoane este i rezultatele sunt valabile doar la acest nivel, Dac efectuim wn studi adancit privind motivarea optiunilor, sebimbarea lor ete, putem objine, evident, rezuluite titeresnnie. 19 130 Rot AREA CERCETARI SOCIOLOGICE De fapt, tot acest exercitiu (care nu este totusi gratuit, din moment ce unii ,analisti polite” mizeazit pe asemenea ,cercetiri”) conduce Ja concluzia implicata in punctul de pornire al demonstratiei (stiam deja cé un esantion trebuie si fie suficient de mare, iar 10 nu este un numér mare). Am fi putut demara rationamentele cu eroarea standard. Continuiim ins strategia adoptata si sporim n la 100; se objine eroarea standard a proportiei de 0,6. 20,6 0,4/100 5 = 01 Parametrul in populatie se situeaza pe spatiul 0,5-0,7 (adic& intre 50% si 70%), ceea ce este inci inacceptabil pentru estimari Daca sporim pe n lt 400, ajungem in zona acceptabili pentru studiile descriptive. ©; = 0,05, dar spatiul de estimare este in i A mare: 0,55-0,65 (95-65 %). Putem si analizaim toate celelalte ipoteze privind marimea esantionul si eroarea standard doriti. Ne vom indrepta insd atentia asupra unei alte probleme. Este vorba de faptul ci eroarea standard poate fi corect exprimati doar dup% ce am efectuat cercetarea si cunoastem valorile variabilelor in esantion (avem deja statisticile). Pentru efectuarea de inferente si determinarea semnificatiei statisticilor pentru colectivitatea totali, se impune si se cunoasci erorile de esantionare pentru fiecare variabili. Analizele pe subesantioane mici vor releva erori standard mai mari dect nivelul teoretic stabilit inigial, Am retinut deja c& diferitele scheme de esantionare reclami forme specifice de calcul al erorilor de esantionare. Daci rezult o eroare de esantionare mai mare de + 5%, mu se mai pot efectua inferenje cu un grad acceptabil de precizie, fie ci este vorba de o variabili la nivelul esantionului sau pe subesantioane. O regula de comportament preventiv ar fi aceea de a nu se proiecta esantioane 1a limitele minime de acceptabilitate (Probabilitate de 0,95, dar mai ales erori standard de 5%). Pe de alti parte, este de retinut faptul ci cercetitorul trebuie si determine mvirimea total a erorilor (E,) ESANTIONAREA IN CERCETAREA SOCIALA 1st E,=X,-m, unde X, este valoarea adevirati a mediei in populajie, iar m ~ media esantionului. Eroarea total de esantionare este compusi din erorile de esantionare, care, la randul lor, pot fi de selectie si de estimare, erori datorate variabilitéqii si omogenititii esantionului, dar si din afara esantionului (incompletitudinea listei, non-rispunsurile si erorile de misurare) (G. Henry, Practical sampling, 1990). ‘Sunt necesare calcule speciale pentru determinarea erorii standard, in funcfie de schema de esantionare utilizata. La esantionarea stratificata se insumeazi erorile pe strat; va rezulta o eroare standard inferioard esantioniirii simplu-aleatorii. fn schimb, la esantioanele cluster si multi- stadiale, eroarea standard este mai mare decdt in cazul esantionarii simplu-aleatorii (L. Kish, A Confidence Intervals for Clusters, 1957). ‘Astfel, la esantionarea stratificat’ calculul erorii standard se realizeazi dupa formula : B, = [5 (wmz)al*. Eroarea standard pentru fiecare strat este ponderati cu miirimea stratului (W, = N, / N), ceea ce reduce eroarea standard total’ (E,). {fn schimb, la esantionarea cluster, eroarea standard se calculeazi dup’ formula: B, = {t-a/A)Slm, -m} fava), unde a este numirul de clustere selectate, A este numérul total de clustere in populatie, m, este media esantionului, iar m este media total (G. Henry, op. cit.). Daca procentele comparate sunt apropiate, estimarea diferenjelor dintre ele reclama esantioane mai mari. ESOMAR (Societatea European pentru Cercetarea Opiniei si Marketing), in Ghidul siu (acceptat de Comisia International de Comer}, in aprilie 1990), recomand esan- tioane de 1.500-2.000 persoane, pe considerentul ci 0 eroare standard de 3% ar corespunde unui esantion de 1.000 persoane la P = 0,95. Diferenja 132 PROIECTAREA CERCETARI SOCIOLOGICE semnificativa dintre doua procente este de 5,7 puncte procentuale. Nevoia de crestere a nivelului de precizie a predictiei conduce la mirirea volu- mului esantionului (ESOMAR, editie revizut’, 1993) in cercetirile efectuate la ICY, ca i in alte institute de cercetare a opiniei si de marketing se utilizeazi adesea esantioane cu peste 2,000 de subiecti. La randul su, Comisia National pentru Statistick realizeazi cate un esantion lunar de 3.000 persoane in ancheta intreprinsi in gospodiirii privind veniturile (AIG) ~ anual realizan- du-se un esantion de 36.000 persoane -, iar in ancheta referitoare Ja forta de munci (AMIGO), miirimea esantionului trimestrial este de circa 18.000 persoane (Comisia National pentru Statistic’). La egantioanele multistadiale si cluster, pe King determinarile erorilor de esantionare pot fi necesare gi alte calcule pentru estimiri cét mai adecvate ale parametrilor populatiei totale, cum ar fi ponderarea pentru selectia cu probabilitati inegale (W= P, / P,, unde P, este proportia in colectivitate, iar P, proportia in esantion), ca si pentru non-rispunsuri. Gary Henry recomanda considerarea celor care nu rispund ca pe un strat gi evaluarea impactului asupra estim‘rilor din egantion. 4.4, Tipuri de esantionare Criteriul principal de diferentiere a esantionatii este legat de caracterul probabilist (aleatoriu), respectiv neprobabilist. In esantionarea probabi- list, fiecare element (unitate statistics) din universul cercetarii are sansa cunoscutii de a fi selectat pentru cercetare, probabilitate diferit% de zero, egala sau variabili. Datoriti acestui fapt, in esantionarea probabilistii se poate calcula eroarea standard de estimare a nivelului unei valori objinute in cercetare si, prin aceasta, se face extinderea rezultatelor la nivelul colectivittii totale. fn esantionarea neprobabilist4 nu este posibila esti- area de 1a egantion la colectivitatea total. Nu se pot efectua inferente statistic, deoarece nu se poate determina eroarea standard a unei valori ‘medil sau a hull procent (proportie). EANTIONAREA IN CERCETAREA SOCIALA 153 Esantionarea probabilist{ este la réndul ei de doua tipuri: simplu-aleatorie si stratificat’. in esantionarea simplu-aleatorie, uni- versul cercetirii este tratat ca un tot nediferentiat. Ea este aplicabila cind colectia statistic’ este relativ omogent in privinta criteriului (criteriilor) de esantionare. Selectia unitiilor statistice se efectueazi direct din ansamblul universului cercetirii, iar probabilitatea unei unititi statistice de a fi aleasd in esantion este egal cu fractia de esantionare (p = f = n/N). La egantionarea probabilist-stratificatA se realizeazd o diviziune a universului cercetirii in sectiuni (straturi) semnificative determinate de numirul valorilor variabilelor folosite drept criteriu de clasificare. Strati- ficarea se face pentru a asigura selectia proportional din fiecare strat. Acest fapt prezint o important’ deosebiti cénd straturile sunt de dimen- siuni diferite, situatie in care populatia din straturile mici nu ar fi selectata prin schema simplu-aleatorie sau ar fi selectata intr-un numiir insuficient. in esantionarea stratificat& se determina céte un subesantion pentru fiecare strat, iar egantionul total este suma subesantioanelor pe stratu in general, m&rimea esantioanelor este proportionali cu mirimea straturilor. La esantionarea stratificat& proportional’, subiectii au aceeagi sansi de a fi selectaji. La straturile de dimensiuni mici, se poate utiliza © probabilitate mai mare de selectie a subiectilor. Numarul straturilor creste pe misura cresterii numdrului de variabile si a numirului de diviziuni ale acestora. O stratificare dup sex are dou’ straturi, una dup vast poate avea 5 sau 10 straturi, caz in care stratificarea combina, dupa sex si varst, ar avea 10, respectiv 20 de straturi. ‘St exemplifictim situafia pentru populatia adultd (varsta de peste 18 ani) in care se face stratificarea dup’ sex si varsti (date din Anuarul Statistic al Romaniei, 1996), I. Universul cercetiirii (N = 16,8 milioane) If, Ksantion (N = 2.000) (valori absolute) a) Sex a) Sex 1. Femei = 51,6% 1. Femei = 1032 2 Birbaji = 48,4% 2, Birbati = 968 154 PROIECTAREA CERCETARII SOCIOLOGICE b) Varst (in ani) b) Varst’ (in ani) 1. 18-19 = 4,6% 1, 18-19 = 92 2. 20-24 = 10,8% 2, 20-24 = 216 3, 25-29 = 11,0% 3, 25-29 = 220 4, 30-34 = 7,7% 4, 30-34 = 154 5. 35-39 = 10,2% 5, 35-39 = 204 6. 40-44 = 9,6% 6. 40-44 = 192 7. 45-49 = 8,1% 7, 45-49 = 162 8. 50-54 = 6,7% 8, 50-54 = 134 9, 55-59 = 7,9% 9. 55-59 = 158 10. 60 si peste = 23,4% 10. 60 si peste = 468 Structura combinata ‘Varsti/sex Femei Barbaji Virstd/sex Femei Barbafi 1. 18-19 22 24 1.1819 44 48 2, 20-24 53 5,5 2.2024 106 «110 3. 25-29 54 5,6 3, 25-29 108112 4, 30-34 38 3,9 4.30-34 716 B 5, 35-39 48 54 5,35-39 96 108 6. 40-44 49 4,7 640-44 98 94 7. 45-49 41 4,0 7.4549 82 80 |. 8, 50-54 343,38. 50-54 68 66 9, 55-59 42 3,7 9, 55-59 84 4 10. 60 sipeste 13,5 99 10. 6Dgipeste 170 198 Dac se doreste ca fiecare strat si aib& reprezentativitate relativ inalti, este nevoie de utilizarea unei alociri neproportionale pe straturi. Se acordi sanse mai mari pentru straturile mici. La structurile simple considerate ar fi cazul reprezentarii tinerilor de 18-19 ani, iar la structura combinati, cu exceptia stratului 60 ani si peste, se impune o crestere a subesantioanelor, mai ales dacti se are in vedere analize pentru fiecare strat, ceca ce ar conduce la un esantion total mai mare. ESANTIONAREA IN CERCETAREA SOCIALA 155 Dificultatea practicarii esantionarii probabiliste se refera la intocmirea listei, intr-o ordine intamplitoare (randomizare), cu toate unititile (mem- brii) din universul cercet&rii, Mai mult, la esantionarea probabilist-stra- tificata sunt necesare listele pentru fiecare strat in parte. In conditiile unor evidente statistice adecvate, de tipul Registrului general al popu- latiei, operatia de elaborare a esantioanelor probabiliste se poate realiza cu usuringi. in multe {iri, Oficiile de statistic’ furnizeaz& la cerere (si contra cost) asemenea esantioane probabiliste. © alti dificultate a acestor tipuri de esantioane, avand in vedere gradul mare de raspandire in teritoriu a subiectilor, priveste costul ridicat si timpul necesar realizarii cercetirilor. Procedurile de selectie probabilisti sunt cele ale numerelor intam- plitoare, ale loteriei si ale pasului mecanic (selectie sistematica). Procedura numerclor intamplitoare presupune atribuirea fiectrei unititi statistice a unui numir, generarea unui tabel cu numere intim- plitoare (acestea pot fi gisite si in c&rjile de statistica). Fiecare numir intamplitor are un numar de cifte corespunzator numirului de cifre ale ultimei unititi statistice din universul cercetirii. Pentru esantionarea simplu-aleatorie a populatiei adulte a Romaniei, ne-ar trebui un tabel cu numere intimplitoare alciituite din céte 8 cifre (in care cel mai mic este 00000001, iar cel mai mare se situeaz undeva intre 16 si 17 milioane). La esantioanele extrase din colectivitati mici, situatia se simplifica mult, avnd in vedere ci am avea de ales esantionul din céteva mii sau chiar sute de persoane, cum ar fi o list a unei localititi, a unei sectii de votare. Aici este suficient un tabel cu numere intdmplitoare alc&tuite din cfte 3 sau 4 cifre, Primul numér intimplitor din tabel indict numarul primului subiect ales si aga mai departe. Dac& in tabelul de numere intamplitoare exist un numiir mai mare decat in universul cercetarii, se trece la urmitorul numiir intamplitor. Metoda loteriei (a urnei) se utilizeaza cand numirul colectiei din care se face extragerea este relativ mic, de ordinul cétorva zeci. Fiecare unitate de selectie este introdusi in urna gi se extrag atdtea unitii cate sunt repartizate pentru nivelul respectiv (asemandtor extragerii numerelor cistigitoare la loto). Cand colectia din care se face extractia este mare, ru se mai poate respecta principiul sanselor egale, mai ales dacii urmeazi 156 PROIECTAREA CERCETARII SOCIOLOGICE sf se extragt un numiir mic de unitigi. Raportul optim N/n este in functie side modalitatea de extragere, dar nu ar trebui s& fie mai mare de 100 (!) (Nu am gisit un calcul efectuat pentru aceasti problema). in practic’, se utilizeazi adesea o alt& proceduri de selectie a unitatilor statistice. Este vorba de selectia sistematicd (a intervalelor egale sau a pasului). Aceast{ procedura se indeparteaza intr-o anumit& misuri de cerinjele selectiei probabiliste. Este ins% in general acceptatd cel putin ca selectie cvasialeatorie. Pentru H. Blalock, procedura de selectie siste- matic (mecanic&) ar reprezenta un tip distinct de esantionare probabilistt pe considerentul ci se indeparteaz de procedura simplu-aleatorie, Totusi si el consider’ ct atunci cand lista universului cercetirii este intocmita dup’ principiile randomizarii (fara o ordine anume, nici ca importanta si nici eventuale cicluri) si este complet, egantionarea sistematici se apropie de cea simplu-aleatorie (H. Blalock jr, Social Statistics, 1972). data intocmita lista cu unitiile statistice, se determing raportul N/ n (care devine pasul de selectie). Pentru a alege 10 unititi din 400, se aplic un pas de 40. Se alege mai intai un numar mai mic de 40, si apoi se aleg urmatoarele 9 unititi din 40 in 40, Daca exist un dubiu pentru includerea unititii de la un numar selectat, se alege numdirul imediat mai mic sau mai mare, La selectia unitiilor statistice se are in vedere constituirea si a unor rezerve (mai ales in egantionarea persoanelor), deoarece este posibil ca unele si nu fie identificate, altele si nu fie disponibile etc. Rezerva se stabileste 1a 10-20% din esantionul de studiat, Nu se utilizeazi inst rezervele inainte de a avea certitudinea posibilitatii de studiere a uneia sau mai multor unititi selectate. Datoritd imprastierii mari a esantioanelor nationale gi a lipsei cadrului general de esantionare, se practic adeseori scheme de egantionare cu mai multe stadii. Astfel, cercetarea empiric se va concentra pe anumite zone, iar listele cu unitatile statistice din care se face selectia se intocmese numai pentru zonele respective. intr-o esantionare bistadialit se selecteaz4 mai intai zonele (localititi, zone in cadrul localititilor, cum ar fi sectiile de votare, zona de recenstimant ete., numite clustere), iar in stadiul al doilea se selecteazi subiectii de pe listele zonelor retinute pentru studiu. ESANTIONAREA IN CERCETAREA SOCIALA 137 Schema bistadiala este in general acceptati ca fiind apropiati de egantionarea simplu-aleatorie, $i esantionarea multistadiald este ins trataté de cdtre unii autori ca un tip specific, cvasialeatoriu de esantionare (HL. Blalock jr, op. cit.). Cert este c& esantionarea multistadiali mareste nivelul erorii standard de estimare a valorilor (a erorilor de esantionare).. La rdndul stu, C.A. Moser trateazi esantionarea de tip cluster ca un caz special al esantionarii multistadiale (C.A. Moser, op. cit.). in esantionarea cu mai multe stadii se impune si avem informatii despre zonele ce constituie obiect de slelectie; cate sunt, o list a lor, delimitarea clara, indicatori sintetici de caracterizare, posibilitatea procu- nirii listelor cu unitatile statistice ce vor fi supuse selectiei. in lipsa acestor ultime liste, se poate trece la efectuarea de microrecenstimantun in zonele de referinti. Metoda L. Kish (dezvoltatd in deceniile 6-7 la Institutul de Cercetiri Sociale din Ann Arbor, Michigan, SUA pentru esantionarea la nivel local si najional) presupune decuparea de ari teritoriale relativ egale pe hart, fra nici o informajie despre caracte- risticile acestora. Se selecteazi aleatoriu un numir de arii, se realizeaza un microrecensmant in interiorul acestora si se face selectia unititilor statistice in vederea studierii lor. O varianta de alegere sistematica in clusterul final este aceea a grilei de alegere a persoanelor de pe o list de adrese. Unii cercetitori introduc, am zice nepermis, in rindul schemelor probabiliste si modalitati de lucru in care efectiv nu se realizeazi select statistice, Este cazul procedurii numite ,,ruté stradal”, in care opera- torilor li se cere si viziteze un numir de adrese folosind un anumit interval si eventual o grili de stabilire a persoanelor. Totusi, dac& strazile nu au fost initial selectate printr-o anumiti procedura probabilista, nu este posibili estimarea reprezentativitatii la nivel najional sau de loca- litate. De fapt nu existi un element de refering’ de tipul unei colectii statistice, pentru care si se efectueze estimirile parametrilor. Cel mult poate fi vorba de populatia totali care locuieste pe strizile unde se efectueazi studiul, considerind grila de alegere a persoanelor studiate 0 schema sistematic’. in acest fel, s-ar putea acoperi o localitate mica Aplicarea ei pe localititi mari este insi hazardatt 138 PROLECTAREA CERCETARII SOCIOLOGICE O alta clasificare a esantioanelor se refera la caracterul unitatii statis tice finale de selectie. Aceasta poate fi constituiti dintr-un singur element, caz in care avem esantion individual, sau din mai multe elemente ~ esantion de grup (cluster). Pentru evitarea unor confuzii, ar fi de preferat ca denumirea de esantionare cluster si se foloseasc numai in acest ultim caz. Ea semnifict faptul ci unitatea statistic& finald este un grup care se studiazii in totalitate. Aga apare clara si distinctia fay de esantionarea multisiadiala, unde in clusterul final se face 0 selectie aleatorie a subiectilor ce vor fi studiati. Mai mult, la esantionarca multistadial’ sunt utilizate 0 serie de diviziuni care de fapt nu sunt erupuri. Or, in esantionarea cluster propriu-zisd, populatia se repart- zeaza sau este deja constituitd in grupuri, alc&tuind structuri ierarhizate: clase de elevi intr-o scoali, echipe de lucru intr-o fabrici etc, H. Blalock se refera la faptul c&, daci straturile trebuie si fie cat mai ‘omogene in interior si mai diferite unele de altele, clusterii trebuie si fie ct mai aseminditori intre ei si cAt mai diferentiati in interior (si reproduct structura colectivititi totale, caz in care ar fi suficienti studierea unuia singur). in astfel de cercetéri nu suntem interesati doar de comporta- mentele individuale, ci si de cele ale grupului luat ca intreg. La réndul séu, Gary Henry, enumerdnd cinci tehnici de esantionare probabilista: simplu-aleatorie, stratificati, sistematict, multistadiald si cluster, face distinctie intre ultimele dou, in functie de modul cum se aleg subiecti. Laegantionarea multistadiala, din cluster finali se selecteaza aleatorin subiectii in esantion (se pierde insit imaginea despre grup ca intreg), Pe cand la egantionarea cluster se studiaz’ toti membrii clusterilor finali selectati aleatoriu (G. Henry, op. cit.). Evident ci nu se pune problema respingerii denumirilor folosite de un autor sau altul, Un cercetitor trebuie si fie ins foarte atent la implicatiile schemelor de esantionare pe care le foloseste. (© schemd multistadiali de esantionare probabilist-stratificata, utilizatt in Rominia in studiile de opinie publica si de marketing, consti in considerarea drept criterii de stratificare a provincitlor istorice, a mediului rezideniial gi a mirimii localititilor urbane. in ESANTIONAREA IN CERCETAREA SOCIALA 139 primul stadiu se selecteazi localitagile, in al doilea stadiu sunt selectate sectiile de votare din localititile retinute anterior, iar in al treilea stadiu sunt selectati subiectii, de pe listele electorale. Un esantion de 1.200 persoane, considerand 10 persoane pe fiecare sectie studiata, conduce la selectarea a 120 sectii de votare (ideal ar fi considerarea circumscriptiei statistice de recensimant, deoarece ar exista date de caracterizare a populatici, ins’ aceste liste nu sunt disponibile), distribuite proportional pe localititi si provineii. in ocul provinciilor istorice se pot determina diferite arii culturale (D. Sandu, Statistica m stiinjele sociale, 1992). La esantionarea neprobabilisti, selectia persoanelor urmeaza o proce- dura preferengial (convenience) sau bazati pe experienti Gudgment) (L. Kazimier, Statistical Analysis for Business and Economy, 1967). ‘Cea mai cunoscuti schemi de esantionare neprobabilist este cea pe cote. in faza de proiectare, aceasta schema se aseam’ni cu constituirea straturilor in esantionarea probabilisti. Diferenta const in faptul c& la esantionarea probabilist-stratificata, in selectia persoanelor se umeazil o procedura aleatorie, la esantionarea pe cote se repartizeaz’i operatorilor doar numarul si structura de realizat, urménd ca ei si fact selectia cu 0 procedura neprobabilista. Esantionarea pe cote are caracter stiintific. Ea permite obtinerea de rexultate satisicatoare gi la costuri mult mai mici. Pari a se putea determina eroarea de egantionare si a se face inferente de la esantion la colectivitatea total, acest tip se poate dovedi uneori mai relevant decat unul probabilist inadecvat realizat (ceea ce conduce la distorsiuni impor- tante gi abateri de la reprezentativitate). intr-adevir, in cercetirile bazate pe esantionarea pe cole, stratificati dupa criterii semnificative, se obtin date pentru descrierea si explicatia domeniului studiat. De mentionat c& esecul de a asigura selectia probabi- list&, intr-o schemd astfel definitd (cum ar fi metoda rutei stradale), ca si atunei cand eroarea este inacceptabil de mare, ne aduce de fapt in situatia unei esantioniri neprobabiliste. Gary Henry utilizeaz denumirea de esantionare neprobabilistd nu numai pentru esantionarea pe cote, ci si pentru diferite proceduri de 160 PROIECTAREA CERCETARII SOCIOLOGICE constituite a colectiilor de cazuri de care aminteam anterior : cazurile tipice, extreme, similare, esentiale, metoda ,bulg’relui de zipada” GG. Henry, op. cit., 1990). “Toate aceste abordari, precum si altele asemanatoare de tipul esantio- nfrii teoretice, a esantionarii calitative, a esantionarii de oportunitate, nu sunt in masurd st introduc un discurs coerent asupra teoriei esantionaiti, procedeele respective avind cu totul alti semnificatie, care a fost deja analizatd. Or, in esantionarea neprobabilistd se respect una dintre cerin- {ele esantiondrii, respectiv mfrimea esantionului, de unde indreptitirea utilizarii termenului. Obiectivele diferite ale cercetirii, urmérite intr-un caz sau altul, conduc 1a adoptarea unor tipuri diferite de esantioane, cum ar fi cele unice (utilizate 0 singurk dati) si cele panel (utilizate in mai multe cercetiri), respectiv esantioane de baz si esantioane multifazice. ‘Daca egantionul de baz reprezint& o reducere la o anumit& scara a universului cercetarii, suficient de mare pentru a servi la elaborarea ulterioar de esantioane reprezentative, esantionul multifazic (sau ierar- hizat) se refera la faptul eX dintr-un esantion utilizat la un moment dat se extrag esantioane mai mici pentru unele studii paryiale (T. Rotariu, P. Hut, Ancheta sociologica si sondajul de opinie, 1997). ‘La randul su, esantionul panel (fix) serveste la misurarea schimbarii si la analiza sensului principal al determinarii in cazul variabilelor ce se influenteaz’ reciproc. Proiectarea, construirea si pistrarea esantioanelor fixe reprezentative ridic’ o serie de probleme, insti avantajele studiului panel compenseaza eforturile depuse. in plus, esantioanele fixe se realizeaz’ cu costuri reduse, comparativ cu determinarea Ja fiecare ancheti in parte, iar informatiile obyinute ~ cel mai adesea - sunt mai complete si mai sigure decat cele din cadrul anchetelor sociologice unice (S. Chelcea, I. Mirginean, I. Cauc, Cercetarea sociologica. Metode si tehnici de cercetare, 1998). Printre problemele critice ale esantionului panel enumerdm: partici- parea, mortalitatea si condifionarea, Practica studiilor panel arati c4 doar 8 din 10 persoane solicitate consimt s& fie incluse in astfel de csantioane. Daci exist anumite ESANTIONAREA IN CERCETAREA SOCIALA 161 diferenje, relevante pentru cercetare, intre cei care accept si participe si cei care refuzi, reprezentativitatea are de suferit Apoi s-a constatat cli numai o parte din persoanele care au consimyit s& participe in panel coopereaza in continuare cu cercetitorii. La randul Jor, schimbarea adresei, modificarea statusului persoanei, decesul pro- voaca alte pierderi (,mortalitatea”) esantionului fix. Cit priveste condifionarea, ea se referd la modificarea comporia~ ‘mentului celor studiagi doar pentru faptul ed au intrat in esantionul panel. in cercetarea panel asupra calititii vietii organizati la ICCV (coordonator 1. Marginean), pentru 3 ani consecutivi (1996, 1997, 1998), s-a objinut o recuperare de 77% in amul al doilea si de 58% in anul al treilea fat de primol an, {in practica s-au imaginat diferite modalitati de corectare a esantionului panel si pistrarea reprezentativititi, cum ar fi: adiiugarea de persoane selectate aleatoriu de pe o list’ de rezervi, compararea rezultatelor cu cele ale unui esantion alternativ etc. Recomandiri pentru studiu De aprofundat constructia schemelor de esantionare si de analizat implicajiie acestora. Bibliografie selectiva Moser, C.A., 1967, Metode de anchetd in investigarea fenomenelor sociale, Editura Stiintifica, Bucuresti. Rotariu, T., Hut, P., 1997, Ancheta sociologica si sondajul de opinie, Editura Potirom, Iasi. Sandu, D., 1992, Statisticd tn stiinjele sociale, Universitatea Bucuresti ‘Trebici, V. (coord.), 1985, Mied enciclopedie de statistical, Editura $tiintitica si Enciclopedic’, Bucuresti ‘Viisceanu, L., 1986, Metodatogia cercetdrii sociale, Editura Sti Enciclopedict, Bucuresti. ified gi

You might also like