Teste neparametrice

Metodele neparametrice sau de distributie libera in cadrul unei analize statistice,testeaza ipoteza nula sau determina limitele de incredere pentru esantioane sau populatii fara a tine cont de distribututia populatiei.

Tipuri de teste neparametrice (I)
Testul Wilcoxon al sumei rangurilor este un test pentru date neperechi sau imperechiate si este o alternativa a testului t pentru esantioane perechi. Testul Wilcoxon pentru doua esantioane este un test pentru date neimperechiate si este o alternativa a testului t pentru esantioane independente.

Tipuri de teste neparametrice (II)
Testul U Mann- Whitney conduce la Mannrezultate echivalente cu testul Wilcoxon pentru doua esantioane. Testul exact Fisher se aplica pentru tabelele de contingenta de tip 2x2 in aceleasi conditii ca testul chi patrat, dar cand frecventele asteptate sunt mai mici decat 5.

Aplicatii si caracteristici (I) Necesita cateva presupuneriasupra distibutiilor esantioanelor si populatiei supuse studiului. Sunt folosite pentru a analiza esantioane sau populatii ce nu se distribuie normal sau aproximativ normal si pentru care testele parametrice sunt nepotrivite. . dar acestea sunt mult mai usoare in comparatie cu conditiile de validitate ale testului chi patrat sau ale testului t.

. operand de cele mai multe ori nu cu valori masurabile ci cu rangurile valorilor. cum ar fi valoarea medie sau deviatia standard sunt nereale sau nu pot fi determinate.Aplicatii si caracteristici (II) Sunt folosite pentru a analiza esantioane sau populatii pentru care parametrii. dar testele neparametrice. au o putere mult mai mica. Pot fi folosite in locul testelor parametrice pentru a analiza populatii ce urmeaza distributia normala sau aproximativ normala.

Regresia Analiza de regresie are ca scop obtinerea unei expresii matematice cu ajutorul careia valorile unei variabile (x) pot fi folosite pentru a prezice valorile altei variabile (y). X=variabila independenta (sau regresoare)careia ii atribuim valori in concordanta cu realitatea. este deci o variabila nealeatorie. Y=variabila dependenta care ia valori in functie de variabila x .

Cazul cel mai simplu este atunci cand intre variabila x si variabila y exista o legatura liniara. iar daca b<0 dreapta este descrescatoare. atunci potrivita pentru descrierea relatiei este ecuatia y=a+bx a=ordonata de origine b=coeficientul de regresie (panta dreptei) sau tangenta unghiului pe care dreapta il face cu axa OX Daca b>0. a indica valoarea lui y corespunzatoare lui x=0 b indica cresterea variabilei y la cresterea cu o unitate a variabilei x. . dreapta este crescatoare.

Coeficientii b si a se estimeaza pe baza metodei celor mai mici patrate care minimizeaza suma patratelor abaterilor dintre valorile real observate yi.x =yPe baza valorilor lui b* si a* se calculeaza dreapta de regresie y*= a*+ b* . x . prin formulele: b*= n xi yi. 1<i<n. 1<i<n si cele asteptate y*I.xi yi/n xi 2-( xi )2 a*=y-b.

Corelatia Daca ambele variabile (x si y) sunt cantitative si aleatoare.(r) . Corelatia este indicata prin coeficientul de corelatie. Asociatia este deci reciproca si nu intr-un singur sens ca in cazul intrregresiei. atunci relatia statistica dintre ele apartine domeniului corelatiei si un scop aici este sa se indice gradul de asociere sau de legatura intre cele 2 variabile.

. imseamna ca modificarea unei variabile este foarte puternic asociata cu modificarea liniara directa a celeilalte variabile.Cand se apropie de -1 modificarea unei variabile este puternic asociata cu inversul modificarii liniare a celeilalte variabile .Cand coeficientul de corelatie se apropie de +1.Cand coeficientul de corelatie este egal cu 0. inclusiv: . inseamna ca nu exista asociatie intre modificarile celor 2 variabile. Coeficientul de corelatie variaza intre -1 si +1. . asocierea fiind reciproca.Aplicatii si caracteristici (I) Coeficientul de corelatie simpla numit coeficientul de corelatie Pearson este folosit pentru a indica gradul asocierii liniare intre 2 variabile.

Aplicatii si caracteristici (II) Un coeficient de corelatie poate fi calculat corect numai cand datele ambelor variabile se refera la esantioane si fiecare este ales independent. in sensul ca observatiile a 2 variabile se pot corela foarte bine fara sa avem motive logice si stiintifice ca una dintre variabile poate fi cauza celeilalte. . Un coeficient de corelatie poate fi apropiat de ±1. deci ne va indica o corelatie puternica. dar ea poate fi nesemnificativa din cauza volumului mic a esantionului studiat. Corelatia nu trebuie identificata cu cauzalitatea.

este alternativa neparametrica a coeficientului de corelatie Pearson .Calcul r= xiyi-( xi)( yi)/n/(SDx)(SDy) Coeficientul de corelatie al rangurilor (Spearman) testeaza gradul de corelare intre 2 variabile calitative. de indivizi =1di2 =patratul diferentelor celor 2 clasamente . Se calculeaza cu formula: rs=1-6 di2/n(n2-1) unde n= nr.

O valoare apropiata de +1. pa baza formulei: rk=2T/n(n-1) unde T=suma algebrica a nr. de =2T/n(nranguri superioare. O valoare apropiata de 0. aranjate dupa deria valorilor lui x. in ordine crescatoare sau descrescatoare.Acest coeficient variaza intre -1 si +1. inseamna necorelarea variabilelor. deci avem clasamente identice. Pentru corealtia rangurilor poate fi calculat si coeficientul lui Kendall. inseamna ca suma patratelor diferentelor este aproape nula. iar valoarea apropiata de -1 pune in evidenta discordanta maxima a variabilelor. . respectiv inferioare fiecarui rang al valorilor lui y.

. dupa cum unele variabile sunt constante sau nu.Ca si in cazul regresiei. cand avem in studiu un numar mai mare de variabile. Acestia pot fi de tip partial sau total. apare problema calcularii unor coeficienti de variatie multipla.

Documentatia care permite gasirea unitatilor de selectie se numeste baza de sondaj. dintrPopulatia de origine=colectivitate generala Totalitatea elementelor individuale extrase din colectivitatea generala la care se studiaza caracterele lor principale si care compun esantionul poarta denumirea de unitati de observatie sau de selectie.Esantionajul Esantionul=colectivitate de selectie=colectivitate partial aleasa aleator dintr-o populatie. .

. ci de modul de selectie al acestuia. De intelege prin eroare diferenta dintre valoarea caracteristicii studiate masurate in populatie si valoarea aceleiasi caracteristici. deci se vor selecta esantioane mari atunci cand se doreste o eroare mica.Un esantion este reprezentativ atunci cand el provine prin selectie aleatorie (randomizata) din baza de sondaj. Volumul esantionului determina precizia acestuia. Notiunea de reprezentativitate nu este legata de volumul esantionului. masurata in esantion.

existand un plus de operativitate si un cost mai mic.Avantajele si dezavantajele cercetarii prin esantionaj Efortul depus in cercetare este mai mic. . Un esantion are erori cu atat mai mari cu cat el este mai mic. numite si aleatoare si care pot fi controlate de cercetator. Duce la o acuratete mai mare a rezultatelor deoarece poate fi angajat personal inalt calificat. Datorita alegerii intamplatoare esantionul reproduce populatia cu unele erori.

Nerespectarea alegerii aleatorii face sa apara erorile siatematice (biais). Reprezentativitatea se asigura prin extragerea sa intamplatoare din baza de sondaj.Erorile in cercetarea bazata pe esantionaj Pentru o cercetare de succes este importanta asigurarea unei reprezentativitati a esantionului si a unui nivel satisfacator de precizie. . dificil de a fi cunoscute. Un esantion este reprezentativ daca nu este insotit de erori sistematice.

precizia.Cea de-a doua conditie. Atunci cand volumul esantionului va creste. precizia va fi mai mare. adica structura si proprietatile populatiei originare vor fi mai fidel relevate. . In cercetarea selectiva se inregistreaza erori de esantionaj si erori care nu tin de esantionaj. este dedeterminata de volumul esantionului. Erorile de esantionaj pot fi cunoscute si astfel cercetatorul poate modifica gradul de precizie al studiului dupa necesitatile practice.

Unitatea de masura a erorilor de esantionaj este eroarea standard.Deoarece eroarea aleatorie apare ca efect al hazardului. masura acestei erori este probabila si niciodata certa. ex= x/ n Sx/ n pentru caracteristicile cantitative ep= PQ/ n pq/ n pentru caraxcteristicile calitative ex =eroarea standard a caracteristicii din esantion x= abaterea standard a caracteristicii din populatia de origine Sx = abaterea standard a caracteristicii din esantion ep = eroarea standard a proportiei P=proportia populatiei din populatia generala Q= prportia complementara=1-P complementara=1p=proportia populatiei din esantion q=proportia complementara n=volumul esantionului .

er2tot= er2sis+er2intamp .Erorile independente de esantionaj Sistematice si intamplatoare Erorile sistematice tin de alegerea aleatoare. Ele dispar prin respectarea regulilor selectiei. Erorile intamplatoare sunt generate de inexactitatea aparaturii si a observatorului in general. Cele mai grave sunt erorile sistematice ele putand compromite cercetarea.

n/n-1 in care s este varianta masurata. x. prin formula: x=t .n/nCu ajutorul relatiei x2=s2. iar n este numarul de cazuri din esantionul pilot. x/ n se poate calcula eroarea limita acceptata care va insoti determinarea. coeficientul t . . se poate inlocui cu U . Daca n 30.Determinarea volumului esantionului Pentru calcul se porneste de la eroarea standard datorata numarului prestabilit de unitati de observare. Volumul esantionului este dat de relatia: n=U 2x x2/ x2 .

Alte consideratii in determinarea volumului esantionului Determinarea volumului esantionului este influentata de 2 presupuneri: 1. Esantionul este selectat aleatoriu. Acest indice se aplica daca volumul esantionului depaseste 5-10% din populatie. N=volumul populatiei tinta Aplicarea fpc va reduce volumul esantionului. Indicele fpc se aplica mai des pentru studiile descriptive si pentru selectia persoanelor de control in studiile cazcazcontrol. . Populatia din care provine esantionul este infinit de mare 2. Populatia din care provine esantionul nu va fi niciodata infinita astfel se va aplica corectia populatiei finite. 5Indicele fpc se calculeaza astfel: fpc=n/1+n/N n= volumul esantionului.

Un studiu cu o putere inadecvata nu permite cercetatorului sa testeze ipoteza studiata.95. atunci cand aceasta diferenta intr-adevar exista. . intrDaca puterea este mare.Interpretarea puterii studiilor publicate Puterea reprezinta probabilitatea ca datele studiului vor indica o diferenta intre tratamente sau expuneri.80 si 0. Daca studiul are o putere insuficienta atunci un rezultat care indica lipsa unei diferente semnificative poate fi atribuit deficitului de putere si nu posibilitatii ca ipoteza nula este corecta. Puterea statistica se alege a priori de catre cercetator si de regula se recomanda sa fie intre0. atunci nu avem nici un motiv sa punem la indoiala concluziile studiului.

Tipuri de esantionaj Exista in principiu 2 mari modalitati de esantionaj si anume: Esantionajul probabilistic. nealeator sau empiric. . aleator Esantionajul neprobabilistic.

Esantionajele probabilistice Esantionul aleator. . Fiecare unitate de selectie are sanse egale de a intra in esantion . simplu sau elementar: procedeul de obtinere consta din extragerea la sorti a unitatilor ce vor compune esantionul si vor fi efectiv investigate dintr-o lista in care au dintrfost inscrise si numerotate toate elementele care compun populatia de referinta.n/N se numeste fractiune de esantionaj si arata cat reprezinta esantionul din populatia tinta. Tehnica de sondaj presupune mai intai determinarea volumului esantionului pentru a sti cate unitati trebuie selectionate din baza care contine un numar mult mai mare de subiecti.

Exista 2 posibilitati de extragere probabilistica: 1. Unitatile care vor compune esantionul se extrag una cate una. . In acest caz nu toate unitatile statistice au aceeasi probabilitate de a fi selectate. Sonadjul cu repetitie inlatura acest inconvenient. In acest caz schema se numeste esantionaj sistematic.Extragerea unitatilor din lista se poate face si cu un anumit pas de numarare dat de raportul k=N/n. in care numerele sunt dispuse haotic si se extrag primele 100 de numere. Sondaj cu repetitie (cu repunere) Sondajul fara repetitie consta in genul de selectare tip Loto. Sondaj fara repetitie (repunere) 2. mentinand aceeasi probabilitate de-a lungul deintregii extrageri. O alta posibilitate de realizare practica a extragerii unitatilor este folosirea tabelelor cu numere aleatoare.

Pentru toate tehnicile de esantionaj calitatea esantionului depinde de calitatea bazei de sondaj. Aceasta trebuie sa fie: adecvata (sa contina toata populatia) Completa (sa contina toate categoriile care intereseaza studiul) Sa nu repete aceleasi unitati de mai multe ori exacta (persoanele inscrise in lista sa si existe in mod efectiv) actualizata Convenabila pentru nevoile sondajului .

ci sunt clasate dupa anumite caracteristici. . Caracteristic pentru un strat este omogenitatea interna si neomogenitatea fata de celelalte straturi.Esantionul stratificat Se foloseste atunci cand datele nu sunt dispuse aleator. Se pot delimita mai multe subpopulatii care nu se suprapun si care se numesc straturi.

Selectia startificata cu volum optim folosita atunci cand conditiile enuntate nu sunt respectate.Se pot folosi 2 tipuri de selectie: 1. Esantionajul stratificat permite obtinerea de date precise pentru fiecare strat. Realizarea efectiva a esantionului depinde de existenta unor baze de sondaj oraganizate pe straturi. . Selectia stratificata proportionala folosita atunci cand toate straturile sunt egale si cand caracteristica cercetata se intalneste cu frecvente relativ asemanatoare in fiecare strat sau dispersia este asemanatoare. 2.

atunci cand intocmirea ei este costisitoare sau dispersia populatiei este exagerata. . Principiul de la care se porneste este ca populatia de investigat poate fi imaginata ca fiind constituita din unitati de selectie agregate si ierarhizate.Esantionajul in cuiburi Se foloseste atunci cand lipseste o baza de sondaj care sa contina unitatile de observatie.

se investigheaza apoi toate unitatile de observare din cuiburile extrase.Cuibul este o unitate de selectie heterogena in care sunt agregate mai multe unitati de observare. decat putine cuiburi de dimensiuni mari. Esantionajul in cuiburi se realizeaza in 3 etape:etape:se foloseste ca baza de sondaj lista cuiburilor .se extrag aleator cuiburile ce vor compune esantionul . Pentru a ne asigura reprezentativitatea este de preferat sa se studieze mai multe cuiburi mici. . Esantionajul este mult mai precis cu cat heterogenitatea cuiburilor este mai mare.

Diferenta consta in aceea ca in timp ce in cazul cuiburilor se poate utiliza o singura extragere aleatoare urmata de investigarea tuturor unitatilor din cuiburi . in esantionajul multistadial se fac mai multe extrageri. ca in esantionajul in cuiburi. .Esantionajul multistadial Principiul este ierarhia unitatilor de selectie posibile.

Avantaje:flexibilitate mai mare Indicatie: acele procese care implica teste chimice. care este ea insasi un esantion. deoarece fiecare operatiune de extragere antreneaza cate o eroare de esantionaj. . biologice care pot fi efectuate intr-o cantitate mai mica intrde produs. Se mai numeste esantionaj multifazic.Si in acest caz este bine sa se evite folosirea unui numar mare de extrageri. De regula se foloseste esantionajul bi sau tristadial. cand se cerceteaza intr-o prima faza anumite caracteristici si pe intrbaza lor se determina un al doilea esantion care se cerceteaza in a doua faza. prin extragerea de subesantioane dintr-o dintrcantitate mai mare. Pentru acest procedeu sunt necesare mai multe baze de sondaj.

Metodele nealeatoare pot fi: .bazate pe atingerea unui scop.bazate pe conventie .Metodele neprobabilistice Se bazeaza pe ideea ca reprezentativitatea poate fi asigurata prin alegere rationala. . Sondajul neprobabilistic nu implica selectie aleatoare.

Esantionajul conventional Unitatea de observatie: omul de pe strada. . Nu avem nici o dovada a reprezentativitatii.

metoda cotelor .metoda esantioanelor fixe .esantioane tipice .esantionul in bulgare de zapada .esantionul expertilor .Esantionajul bazat pe atingerea unui scop Selectia se face avand un scop Cel care raspunde trebuie sa indeplineasca anumite criterii Subcategorii:Subcategorii:.

.Esantioanele tipice Se imparte populatia in subansamble omogene si alegem din fiecare o unitate considerata de cercetator ca fiind cea mai reprezentativa.

Esantionul expertilor Include persoane cu experienta si pregatire cunoscute intr-un anumit intrdomeniu. . Motive de alegere: cunoaterea opiniei persoanelor cu experienta si validarea unei alte metode de esantionare aleasa.

ci doar cunoasterea structurii populatiei.Metoda cotelor Este procedeul cel mai utilizat Se bazeaza pe ideea asigurarii unei reprezentativitati prin realizarea unui esantion care sa aiba o structura asemanatoare cu a populatiei. Nu permite evaluarea preciziei estimatiilor . Nu necesita existenta unei baze de sondaj.

Esantionul in bulgare de zapada Se incepe cu identificarea celor care indeplinesc criteriile pentru a fi inclusi in studiu. Aceste persoane sunt rugate sa recomande alte persoane ce indeplinesc aceleasi criterii. .

Metoda esantioanelor fixe Se colecteaza periodic date din acelasi esantion. .

Erori in masurarea unitatilor datorita aparatului de masura care poate fi imprecis 3. Neinvestigarea unor unitati selectionate in esantion datorita imposibilitatii de a localiza indivizii sau datorita refuzului de a raspunde 2. . Erori introduse in procesele de editare. codificare si tabelare a rezultatelor Problema nonraspunsului este principala problema.Surse de eori in studiile pe esantioane 3 surse de erori: 1.

Solutii Reducerea nonraspunsului prin educatia populatiei Revizitarea persoanelor care nu au fost gasite Compararea populatiei refractare cu cea care a raspuns Gasirea unui inlocuitor prin alcatuirea unei liste de rezerva Estimarea nivelului nonraspunsurilor si marirea volumului esantionului corespunzator. unde q=1/1f=rata estimata a nonraspunsului . Pentru aceasta volumul esantionului se inmulteste cu un factor q=1/1-f.

Sign up to vote on this title
UsefulNot useful