GIRU Lecţia 8

Elemente de analiză statistică
Terminologii statistice şi înţelegerea unor elemente fundamentale de statistică
Caracteristicile statistice reprezintă însuşirile fenomenelor studiate. Astfel putem deosebi caracteristici variabile ca formă de manifestare sau ca nivel de dezvoltare.

Caracteristicile statistice care pot avea mai mult decât o singură valoare cu care variază în funcţie de o serie de factori se mai numesc şi variabile statistice iar formele de manifestare ale acestor caracteristici se numesc variante. Variabilele pot fi: dependente dacă sunt spuse influenţei altor variabile; independente dacă sunt variabile ce influenţează alte variabile; continue dacă au un număr infinit al nivelurilor de măsurare; discrete dacă au un număr finit al nivelurilor de măsurare

Elemente de analiză statistică
Scalele de măsurare se referă la modalitatea de măsurare. Programul SPSS utilizează următoarele scale de măsurare: Scală – valorile numerice ale datelor se reprezintă pe un interval sau printr- un raport. Exemplu: vârsta, venitul, temperatura, lungimea, timpul de răspuns. Variabilele reprezentate şi măsurate pe scală trebuie să aibă valori numerice. Nominale – se utilizează atunci când valorile datelor unei variabile reprezintă valori de ordin neintrinsec în funcţie de existenţa sau inexistenţa unei caracteristici. Exemplu: apartenenţa la o anumită categorie de funcţii de încadrare sau sexul: 1 – masculin, 2 – feminin. Ordinale (de ordin sau de rang) – se folosesc atunci când valorile datelor reprezintă categorii de ordin intrinsec care pot fi puse într-o anumită ordine de măsurare. Exemplu nivelul de pregătire: scăzut, mediu, înalt.

deoarece pe baza lor se poate exprima într-o anumită măsură tendinţa unor fenomene. Toate aceste medii se pot calcula ca medii simple sau ca medii ponderate. . media armonică. Acestea sunt: media aritmetică. media pătratică şi media geometrică.Elemente de analiză statistică Mărimile medii. indicatorii variaţiei şi asimetriei Mărimile medii În analiza statistică se utilizează foarte frecvent mărimile medii.

. modulul.Elemente de analiză statistică Valorile medii de poziţie şi de structură Cele mai frecvent utilizate valori medii de poziţie şi de structură sunt: mediana. cuartilele şi decilele. Jumătatea inferioară va conţine termenii ale căror valori sunt mai mici decât valoarea medianei iar jumătatea superioară va conţine termenii care au o valori mai mari decât valoarea medianei. Mediana Mediana (Me) reprezintă valoarea centrală a unei serii statistice care împarte termenii unei seriei în două părţi egale.  Modulul Modulul (Mo) reprezintă valoarea termenului dintr-o serie care are frecvenţa maximă.

Quartilele sunt acele valori ale termenilor care separă seria în patru părţi egale. . decilele. În mod similar decilele împart seria în 10 părţi egale iar centilele în 100 de părţi egale. quartila a doua (medie) (Q2) care este egală cu mediana deoarece împarte termenii în două părţi egale (50%) şi quartila superioară (Q3) care delimitează sfertul superior (75%). decile Pentru seriile cu asimetrie mare şi care au o amplitudine mare a variaţiei se calculează şi alţi indicatori de poziţie cum sunt: quartilele. Deosebim astfel quartila inferioară (Q1) care delimitează sfertul inferior (25%) al termenilor. centilele şi percentilele. Rezultă că vor exista 9 decile şi 99 centile.Elemente de analiză statistică Valorile medii de poziţie şi de structură Cuartile.

180/decizie SAU http//www.comunicare. Analze şi aplicaţii Descărcarea produsului: http//80.0EvalVersion-a.80.ro/resurse/SPSS16.Programul SPSS.exe .96.

Coloanele (câmpurile) reprezintă variabilele distribuţiei. Analze şi aplicaţii Încărcarea. În celulele de intersecţie se află valorile corespunzătoare variabilelor pentru fiecare caz (case). editarea şi transformarea datelor. Liniile reprezintă înregistrările acesteia sau cazurile (cases) cum sunt denumite în SPSS. Componenta Data Editor În SPSS tabela bazei de date este împărţită în linii şi coloane.Programul SPSS. .

o mare parte a cercetării studiază relaţiile dintre două sau mai multe variabile. practic a oricăror date. Metodele de prezentare a relaţiilor bivariante. . includ crearea tabelelor de asociere. necesită studierea tendinţelor fundamentale ale datelor utilizând tabele şi diagrame. Totuşi. O analiză statistică bivariantă completă a datelor.Elemente de analiză statistică Relaţiile dintre două sau mai multe variabile Tabele şi diagrame Analize statisice:  O analiză univariantă ce poate fi utilizată pentru analiza. histograme compuse (diagrame cu bare grupate) şi diagrame scatter.

vor fi cel mai eficient prezentate sub forma unei diagrame scatter. care este cel mai eficient pentru comunicarea relaţiilor dintre date.Elemente de analiză statistică Relaţiile dintre două sau mai multe variabile Tabele şi diagrame Tipul tabelului sau diagramei. . în general. Două variabile numerice. depinde foarte mult de tipul datelor implicate. Două variabile nominale sunt prezentate sub forma unui tabel de asociere.

Elemente de analiză statistică Relaţiile dintre două sau mai multe variabile Tabele şi diagrame Exemplu: Elaborarea unui tabel de asociere şi a unei diagrame cu bare compusă. Aceasta va prezenta numărul de barbaţi şi femei care au fost spitalizaţi sau nu anterior. Bărbaţi Spitalizaţi Nespitalizaţi 20 30 Femei 25 14 .

.Se selectează Analyze-Tables... Crearea tabelelor asociate .Se activează Data şi se selectează Weight Cases.Tables% .Statistics. ... Afişarea frecvenţelor cu procentaj din numărul total .Add – Continue –OK. 1. Cases .Etichetarea celor două valori pentru stare_pacient si gen. Rezolvare: Introducerea datelor  . 1.Se selectează frecvenţa şi se bifează caseta Weight cases by. . Editor 1..Definirea variabilelor in modul de lucru Variable View din Data View.Basic –Tables..Trecerea în modul de lucru Data View din Data Editor. ..Basic –Tables..Elemente de analiză statistică Relaţiile dintre două sau mai multe variabile Tabele şi diagrame 1..Analyze-Tables. Ponderarea datelor în funcţie de frecvenţă .

. Dacă se adună procentele de pe fiecare coloană.. Rezolvare: Afişarea frecvenţelor cu procentaj din suma coloanei .Basic –Tables.. numită ColPerCent) ColPerCent pentru cele două bare şi se ponderează.Elemente de analiză statistică Relaţiile dintre două sau mai multe variabile Tabele şi diagrame  5.Se introduc cifrele de procentaj (col. Diagrama procentuală compusă cu bare (suprapuse). . – Stacked – Define ..Add – Continue –OK.Col% . ele vor însuma 100%.. 6.Statistics. .Se selectează stare_pacient şi se activeatză butonul de pe langă eticheta Category Axis şi apoi Butonul OK.. .Se selectează opţiunea Graphs – Bar...Analyze – Tables .

... Cases Se selectează frecvenţa şi se bifează caseta Weight cases by.Se selectează opţiunea Graphs – Bar.Se selectează Genul şi apoi butonul de pe lângă eticheta Define Stacks. Histogramă compusă (diagramă cu bare grupate). . OK .Se selectează % of cases şi apoi OK. ..Se ponderează cazurile după frecventă Se activează Data şi se selectează Weight Cases. – Clustered – Define.Elemente de analiză statistică Relaţiile dintre două sau mai multe variabile Tabele şi diagrame  Rezolvare: 7.. Define .Se selectează Stare_pacient şi se activeatză butonul de pe langă eticheta Category Axis. .

variabile Diagrama scatter prezintă.Elemente de analiză statistică Coeficienţi de corelaţie Coeficienţii de corelaţie Pearson şi Spearman Există mai mulţi coeficienţi de corelaţie. pînă la -1.00. Dar cel mai comun şi cel mai folositor este pe departe coeficientul de corelaţie Pearson.00. Intervalul de valori este de la maximum +1. de regulă. . adică scorurile unei variabile se măresc odată cu creşterea scorurilor celeilalte variabile. Semnul „+“ indică o corelaţie pozitivă. Un coeficient de corelaţie este o măsură numerică sau un indice al grdului de asociere între două seturi de scoruri. adică în timp ce scorurile unei variabile cresc. prin 0. scorurile pentru cealaltă descresc.00. datele incluse într-un coeficient de corelaţie. Coeficientul de corelaţie Pearson presupune o relaţie în linie dreaptă între două variabile. Semnul „–“ indică o corelaţie negativă.

00 indică o asociere perfectă între două variabile.Elemente de analiză statistică Coeficienţi de corelaţie Coeficienţii de corelaţie Pearson şi Spearman O corelaţie de 1.5 ar indica o relaţie moderat negativă între cele două variabile. O valoare de 0. 0. Este folosit atunci când premisele coeficientului de corelaţie Pearson nu sunt îndeplinite de către date. Această situaţie se petrece. în momentul în care scorurile pentru o variabilă au o asimetrie pronunţată. . după ce acestea au fost ordonate crescător pentru cele două variabile în parte.00 indică faptul că toate punctele din diagrama scutter sunt dispersate aleatoriu în jurul oricărei drepte desenate pe această diagramă a datelor sau sunt aranjate într-o manieră curbilinie. Coeficientul Spearman este coeficientul de corelaţie Pearson aplicat unor scoruri. O corelaţie de -0.00. Cu alte cuvinte. o diagramă scutter a celor două variabile va arăta că toate punctele sunt conţinute de o singură dreaptă. în special.

Dacă relaţia există. iar intensitatea legăturii dintre cele două variabile se exprimă prin valoarea acestuia. vom deosebi două feluri de corelaţie: pozitivă şi negativă. Cu cât valoarea lui r este mai mare cu atât legătura dintre variabile este mai puternică. puternică . Corelaţia negativă apare atunci când creşterea valorilor unei variabile determină scăderea valorilor pentru a doua variabilă.Elemente de analiză statistică Coeficientul de corelaţie Pearson Coeficientul de corelaţie Pearson se va utiliza atunci când se doreşte măsurarea valorilor a două variabile din acelaşi eşantion pentru a se afla dacă între acestea există o relaţie şi care este intensitatea relaţiei. Felul corelaţiei se exprimă prin semnul coeficientului de corelaţie Pearson (r). Corelaţia este pozitivă atunci când creşterea valorilor unei variabile determină creşterea valorilor celeilalte variabile. Cu alte cuvinte atunci când avem o valoare pozitivă a lui r spunem că între variabile există o corelaţie pozitivă şi invers.

N este volumul eşantionului. . Atunci când se analizează corelaţia se va alege şi un nivel de risc acceptat (în mod convenţional 5%) sau un nivel minim de încredere (în mod convenţional 95%). zy este scorul z al variabilei y. +1]. N ∑z z i =1 x y zx este scorul z al variabilei x. O reprezentare grafică interesantă a corelaţiei poate fi obţinută în SPSS prin intermediul unui grafic de tip Scatter – Plot. Numărul gradelor de libertate df = N – 2.∑ zx z y i =1 N N Elemente de analiză statistică Coeficientul de corelaţie Pearson Expresia coeficientului de corelaţie este: unde r este coeficientul de corelaţie pentru variabilele x şi y. r= N Este de reţinut faptul că valorile lui r pot varia doar în intervalul [-1.

o diagramă scutter şi coeficientul de corelaţie Spearman pentru scorurile abilităţilor muzicale şi matematice a 10 copii.Elemente de analiză statistică Coeficienţii de corelaţie Pearson şi Spearman Exemplu: Calculul corelaţiei Pearson. Scoruri_muzicale 2 6 4 5 7 7 2 3 5 4 Scoruri_matematice 8 3 9 7 2 3 9 8 6 7 .

.Definirea variabilelor in modul de lucru Variable View din Data View. 2-tailed la nivelul de probabilitate este de 0.Elemente de analiză statistică Coeficientul de corelaţie Pearson 1. corelaţia este statistic semnificativă.. Corelaţia Pearson . 10 .Trecerea în modul de lucru Data View din Data Editor.0. . Rezolvare: Introducerea datelor  . Numărul cazurilor pe care este bazată corelaţia este 10. 0.Se selectează împreună sau separat Scoruri_muzicale şi Scoruri_matematice şi se introduc în lista de variabile.001 sau mai mic. Editor 1. Interpretarea output-ului Corelaţia dintre cele două scoruri este de . apoi clic pe butonul OK..Analyze – Correlate – Bivariate.900 La un test de semnificaţie. OK 3.900.

Elemente de analiză statistică Coeficientul de corelaţie Pearson .

0. deci va deveni .000. 0. Nivelul de semnificaţie exact. 0.900 Se obijnuieşte să se rorunjească cu două zecimale. Aceasta înseamnă că nivelul de semnificaţie poate fi raportat ca fiind p < 0.Elemente de analiză statistică Coeficientul de corelaţie Pearson 4. este 0.001 Nu folosiţi un şir de zerouri.  .000 Înseamnă că nivelul de semnificaţie este mai mic decât 0.90 Acesta este un rezultat mai mult decât precis pentru majorarea măsurătorilor psihologice. Raportarea output-ului  Corelaţia dintre abilitătile muzicale şi cele matematice este . Întotdeauna schimbaţi ultimul zero în 1.0. cu trei zecimale. deoarece derutează.90.001.001.900. 0. 0.

când se prezintă corelaţiile. 2 adică 8 pentru această corelaţie. p < 0. Nu este nimic greşit în a raporta numărul de cazuri în schimb.).Elemente de analiză statistică Coeficientul de corelaţie Pearson  Se obişnuieşte să fie prezentate gradele de libertate (df) df în locul numărului de cazuri.90. Într-un raport se scrie: Există o relaţie negativă semnificativă între abilităţile muzicale şi cele matematice. df = 8. Copiii cu nivel ridicat la abilităţi muzicale au nivel scăzut la abilităţi matematice.001.  . (r = .0. Gradele de libertate sunt egale cu numărul de cazuri minus 2.

Corelaţia Spearman . Editor 1..Se selectează opţiunea Spearman şi apoi clic pe OK. . OK 3.. .001 sau mai mic. . Numărul cazurilor este 10. .Trecerea în modul de lucru Data View din Data Editor.Elemente de analiză statistică Coeficientul de corelaţie Spearman 1. Interpretarea output-ului Coeficientul de corelaţie Spearman între Scoruri_muzicale şi Scoruri_matematice este . Rezolvare: Introducerea datelor  .Se selectează împreună sau separat Scoruri_muzicale şi Scoruri_matematice şi se introduc în lista de variabile.Analyze – Correlate – Bivariate. Nivelul de semnificaţie.894. luând în calcul două ipoteze este 0.Definirea variabilelor in modul de lucru Variable View din Data View. deci corelaţia este statistic semnificativă.0.

Elemente de analiză statistică Coeficientul de corelaţie Spearman .

001 Într-un raport se scrie: Există o relaţie negativă semnificativă între abilităţile muzicale şi cele matematice.001). (Coeficientul Spearman = .Elemente de analiză statistică Coeficientul de corelaţie Spearman 4.0.89. 0.90. p < 0.001 (p < 0. 0.0. Copiii cu nivel ridicat la abilităţi muzicale au nivel scăzut la abilităţi matematice şi invers.   .89 Probabilitatea de a obţine această corelaţie din întâmplare este mai mică de 0. Raportarea output-ului  Corelaţia raportată cu două zecimale este . DF = 8.001).

. pentru a avea variabila Scoruri_matematice ca axă orizontală. Se selectează Graphs – Scatter –Define. se selectează şi se apasă butonul  de lângă caseta X Axis. se selectează şi se apasă butonul  de lângă caseta YAxis. Se apasă butonul OK. 4. pentru a avea variabila Scoruri _muzicale ca axă verticală. În fereastra Simple Scatterplot.Elemente de analiză statistică Diagrama scatter  Rezolvare: 1. 2. În fereastra Simple Scatterplot. 2.

Elemente de analiză statistică Diagrama scatter .

   . Forma împrăştierii rezultatelor este relativ în linie dreaptă indicând mai degrabă o relaţie în linie dreaptă decât o relaţie curbilinie. răspândirea punctelor este relativ îngustă. ceea ce indică o corelaţie mare. ceea ce indică o corelaţie negativă. Dacă relaţia este curbilinie. Linia este de la colţul stânga sus până în dreapta jos. atunci corelaţiile Pearson şi Spearman pot fi înşelătoare.Elemente de analiză statistică Diagrama scatter Interpretarea output-ului  În diagrama scatter.

din cauza unor probleme cum ar fi relaţiile curbilinii sau valori atipice. Am putea scrie: A fost examinată o diagramă scatter pentru relaţia dintre abilităţi_muzicale şi abilităţi_matematice.Elemente de analiză statistică Diagrama scatter Raportarea output-ului  Nu ar trebui să raportaţi niciodată un coeficient de corelaţie fără a examina diagrama scatter. atipice  . Nu există nicio dovadă privind o relaţie curbilinie sau asupra influenţei avute de rezultate atipice.

Număr de puncte obţinute la test (variabila x) 230.Elemente de analiză statistică Coeficienţii de corelaţie Pearson şi Spearman Exemplu: Se doreşte să se afle dacă rezultatele obţinute de 9 studenţi la un test aplicat pe parcurs. influenţează notele lor finale la examen.00 .

976 Valoarea acestuia arată că între cele două variabile există o legătură puternică şi o corelaţie pozitivă. . 0.976. În concluzie se poate afirma că studenţii care au obţinut un număr mare de puncte la test au obţinut note mari la examenul final.Elemente de analiză statistică Coeficientul de corelaţie Pearson Raportarea output-ului Coeficientul de corelaţie Pearson calculat pentru cele două variabile este r = 0. Graficul Scatter redă foarte sugestiv aceste informaţii.

Elemente de analiză statistică Coeficientul de corelaţie Pearson .

00 100.00 8.00 7.00 x200.00 250.00 50.00 9.00 150.00 10.00 z .00 6.00 300.Elemente de analiză statistică Coeficientul de corelaţie Pearson 350.

Sign up to vote on this title
UsefulNot useful