You are on page 1of 78

INFORMATIC JURIDIC

Conf. univ. dr. Silvia LUCHIAN

SUPORT CURS

UNIVERSITATEA ALEXANDRU IOAN CUZA IAI FACULTATEA DE DREPT

INFORMATIC JURIDIC

Conf. univ. dr. Silvia LUCHIAN

SUPORT DE CURS

Anul IV Semestrul II

2012-2013

Cuprins

I. ROLUL STATISTICII N CUNOATERE ........................................................................................................ 1 1. EVOLUIA TERMENULUI DE STATISTIC............................................................................................. 1 2. FENOMENE TIPICE VS FENOMENE COLECTIVE. .................................................................................. 3 3. SEMNIFICAII ALE TERMENULUI DE STATISTIC .................................................................................. 5 II. ELEMENTELE DEFINITORII ALE UNUI STUDIU STATISTIC ................................................................ 8 1. POPULAIE..................................................................................................................................... 8 2. CARACTERISTICA STATISTIC........................................................................................................... 9 3. EANTIONUL ................................................................................................................................ 12 4. OBSERVAIILE .............................................................................................................................. 14 Observaiile................................................................................................................................ 14 Prelucrarea statistic primar ................................................................................................... 15 Serii statistice............................................................................................................................. 18
1. 2. 3. Serii cronologice ...............................................................................................................................................18 Serii teritoriale...................................................................................................................................................18 Serii de distribuie de frecvene pentru o variabil atributiv ..........................................................................19

Reprezentarea grafic a distribuiei frecvenelor ........................................................................ 20 III. TIPURI DE DIAGRAME N MICROSOFT OFFICE EXCEL ...................................................................23 1. DIAGRAMA COLOAN .................................................................................................................... 23 2. DIAGRAM COLOAN STRATIFICAT ............................................................................................... 24 3. DIAGRAM STRUCTUR RADIAL .................................................................................................... 26 4. DIAGRAM LINIE ........................................................................................................................... 27 5. DIAGRAMELE RADAR ..................................................................................................................... 31 6. DIAGRAMELE ZON ....................................................................................................................... 31 IV. STATISTICA DESCRIPTIV ........................................................................................................................33 1. ANALIZA SERIILOR STATISTICE ....................................................................................................... 33 2. STATISTICI DESCRIPTIVE PENTRU UN ATRIBUT CANTITATIV ................................................................ 33 2.1. Indicatorii tendinei centrale ................................................................................................ 33 2.2. Indicatorii variaiei ............................................................................................................... 37 2.3. Indicatori de asimetrie si aplatizare(Skewness i kurtosis).................................................. 41 V. LEGTURILE DINTRE FENOMENELE COLECTIVE .............................................................................54 1. SERIILE INTERDEPENDENTE.................................................................................................. 56 1.1. Tipuri de legturi ................................................................................................................. 56 1.2. Metode elementare de verificare a existenei legturilor ..................................................... 58 2. CORELAIA STATISTIC ................................................................................................................. 59 3. DREAPTA DE REGRESIE. ................................................................................................................ 64 4. COEFICIENT DE DETERMINARE ....................................................................................................... 65 MODELE DE TESTE DE VERIFICARE A CUNOTINELOR.69 BIBLIOGRAFIE .....................................................................................................................................................70

I. ROLUL STATISTICII N CUNOATERE Chiar dac v-ai dat sau nu seama, cu siguran c majoritatea dintre dumneavoastr ai fcut o analiz statistic la un moment dat. Situaia dumneavoastr bancar lunar, notele dumneavoastr de la sfritul unui semestru, factura de telefon sunt exemple de date ce pot fi colectate, n cursul a diferite perioade de timp, formnd seturi de date. Deseori, n viaa de zi cu zi, folosim sau auzim expresii cum ar fi: "statisticile arat c .", "o statistic simpl sugereaza c .." etc.. De multe ori, oamenii asociaz statistica cu o simpl "colecie" de date. 1. Evoluia termenului de statistic Faza descriptiv a statisticii echivala cu descrierea statului (de aici i denumirea de statistic). , expunerea situaiei geografice, economice i politice. Se cunosc lucrri din antichitate n care sunt informaii privind resursele umane, materiale militare, comerciale, etc. In evul mediu existau deja coli de statistic ( nc din sec. XIII - XIV n Republica Veneia se elaborau diferite rapoarte care conineau informaii privitoare la partenerii si comerciali i au fost utilizate n politica comercial oficial ) care elaborau tratate n care toate aceste informaii erau susinute cu cifre. In aceast perioada statistica devine un puternic instrument n conducerea statal. Acest gen de statistic a fost cultivat mai nti de italieni. Curentul "descrierea statului" a atins apogeul n sec. XVII- XVII cnd, n Germania, s-a constituit o adevrat coal cunoscut sub denumirea de coala descriptiv german. Descrierea statului a devenit disciplin de predare acadamic, ncadrat ntr-un sistem construit dup norme teoretice i practice, care s-au elaborat i dezvoltat n universitile germane. Noua disciplin a primit numele de statistic (Statistik). Faza aritmeticii politice s-a dezvoltat n Anglia secolului XVI. Reprezentanii acestei coli au pus accentul mai ales pe cercetarea fenomenelor demografice, recurgnd la instrumentul matematic n cutarea legitilor unor fenomene. Studiile demografice lsau s se ntrevad c previziunea fenomenelor colective putea avea o nsemntate practic deosebit (de altfel tabelele de mortalitate i natalitate ntocmite n secolul XVIII au constituit punctul de plecare al societilor de asigurare). Faza probabilistic ncepnd cu secolul XVII statistica descriptiv devine obiect al instituiilor publice iar domeniul conceptual al aritmeticii politice capt o nou dimensiune odat cu introducerea calculului probabilitilor. Promotorii calculului probabilitilor: 1

Jacob Bernoulli (1645-1705)- n lucrarea Ars conjectandi formuleaz legea numerelor mari, definete probabilitatea apriori (deductiv), probabilitatea aposteriori (statistica inductiv) i a schiat posibilitatea aplicrii calculului probabilitilor n economie. Pierre-Simon Laplace (1749-1827)- n lucrarea Theorie analytique des probabilites a evideniat avantajele calculului probabilitilor n studiul fenomenelor dependente de cauze complexe. Karl Friderick Gauss (1775-1855) definete legea de repartiie normal. Simon Denis Poisson (1781-1840) descoper legea de repartiie a evenimentelor rare i dezvolt aplicaii ale calculului probabilitilor n demografie Faza modern a teoriei probabilitilor este marcat de A.N. Kolmogorov (1903) care, prin axiomatizarea noiunii de probabilitate, a transformat teoria probabilitii ntr-o ramur a tiinei matematice, logic construit, asemenea geometriei, pe baza unor axiome. Kolmogorov este reprezentantul colii ruse din care mai fac parte Lyapunov, Hincin, Smirnov, Gnedenko i alii. Datorit unor teoreme demonstrate de Kolmogorov se face conexiunea mai strns ntre teoria probabilitilor i statistica experimental punndu-se bazele statisticii moderne. Karl Pearson (1857-1936) i Ronald Fisher (1890-1962) extind preocuprile statisticii la trei categorii de probleme, specificarea legii de repartiie, estimarea parametrilor, repartiia estimatorilor i introduc noiunea de ipotez statistic. Etapa informaional a statisticii se dezvolt dup apariia teoriei informaiei (Shannon- 1948), considerat drept ramur a matematicii nrudit cu calculul probabilitilor, care se ocup cu problemele matematice ale obinerii, transmiterii i stocrii informaiei, modelul lui Shannon fiind statistico-probabilistic. Etapa sistemic a gndirii statistice este o explicitare a ceea ce s-a realizat de-a lungul timpului ntr-o nou terminologie impus de teoria general a sistemelor (L. von Bertalanffy) i de cibernetic (N. Wiener). Pe terenul statisticii au aprut i s-au dezvoltat numeroase discipline i teorii noi (biometria, econometria, sociometria, jurimetria, cercetarea operaional, teoria deciziilor, etc.). Aceast explozie de noi teorii justific afirmaia lui M. G. Kendall; Statistica n sensul cel mai larg este baza oricrei tiine experimentale, adic o disciplin metodologic care ar trebui s fie familiar tuturor cercettorilor ca i logica de altfel. Statistica, ca principal furnizor de informaii, este indispensabil n activitatea de conducere, fie ea a unor procese economice, politice, sociale etc. fie n conducerea unor procese tehnologice (de producie). Dac cutm n Dicionarul explicativ gsim urmtoarea definiie pentru statistic: 2

tiin care culege, sintetizeaz, descrie i interpreteaz date referitoare la fenomene generale(fenomene colective) 2. Fenomene tipice vs fenomene colective. Fenomenele naturale, pe care diferitele discipline caut s le studieze izolat sau n raporturile dintre ele se mpart , din punct de vedere al metodei de studiu n dou grupe distincte: fenomene tipice i fenomene colective. nainte de apariia tiinei, toate fenomenele preau atipice , grania dintre fenomenele prin identificarea, considerate tipice i cele considerate colective s-a modificat mereu observarea i msurarea a noi factori ce influeneaz respectivele fenomene. Fenomene tipice sunt caracteristice pentru anumite niveluri ale lumii anorganice care: 1. n condiii identice sau similare, se produc n aceeai form.; au numr restrns i precis de cauze ; 2. experienele fcute n domeniul castor fennomane bonduc , prion repaitre , la acelai rezultat, deci au legi rigide de guvernare, explicate prin formule matematice; exemple: P = U*I, S=V*t 3. pentru studiu se folosete experiena de laborator unit cu modelarea matematic Fenomene colective: (generale) sau de mas spre deosebire de cele tipice, sunt fenomene complexe, atipice, rezultate din aciunea combinat i reperat a unui numr mare de factori de influen. Fenomenelecolective, prin definiie, se caracterizeaz prin mai multe elemente specifice: 1. nu se pot reproduce identic aproape niciodat: fenomene sociale , fenomene biologice, unele fenomene anorganice (meteorologie) ; exemple: variaia preului petrolului, rate de schimb, variaia incidenei unei boli etc Astfel , pentru ca, din punct de vedere statistic, esena lor s fie pus n eviden este nevoie de un numr mare de cazuri individuale. De exemplu, pentru formarea preului petrolului este necesar un numr mare de productori i consumatori; a. cauze foarte numeroase i foarte variate ; b. caracterul esenial al variabilitii efectului unei cauze asupra manifestrii fenomenului, adic o aceeai cauz ,adesea de minim importan, poate avea cnd un efect neglijabil , cnd un efect de preponderen capital ;acest fapt d fenomenelor colective nfiarea ntmplrii ,a hazardului ; 2. fenomenele de mas prin definiie - se caracterizeaz prin variabilitate. Variabilitatea este un concept cheie n statistic. Indivizii n aparen asemntori prezint, de fapt, numeroase trsturi distinctive.Astfel de diferene, mai mult sau mai puin 3

semnificative, pot fi nregistrate prin observaii sau msurtori. Aceast particularitate se observ din faptul c fenomenele de mas sunt rezultate ale aciunii unui numr mare de factori de influen cu esenialitate i natur diferit, asociai cu sensuri, direcii i intensiti multiple. Aciunile unor factori de influen se pot compensa reciproc deoarece ei se manifest n sensuri diferite; fenomenele de mas sunt fenomene deterministe, de tip stohastic, produse n condiii de incertitudine; forma individual de manifestare a fenomenelor de mas este diferit. Legitatea de manifestare a acestor fenomene nu poate fi cunoscut i verificat n fiecare caz n parte ci numai la nivelul ntregului ansamblu de cazuri individuale. propriu statisticii este faptul c dei accept variabilitatea ca pe un dat natural, nu nceteaz nici o clip s studieze sistemul de cauze (legile de probabilitate) care o genereaz,n scopul de a institui asupra lor un control ct mai strict. n viaa real nu exist constant venic. Rezultate produse de un sistem constant de cauze variaz i, de fapt, ele pot varia ntre limite largi sau nguste. Ele variaz, dar pun n eviden o caracteristic important numit stabilitate. De ce aplicm termenii de constan i stabilitate unui sistem de cauze ce genereaz rezultate care variaz? Deoarece o aceeai proporie a acestor rezultate ce variaz continu s cad ntre dou limite bine stabilite, or de or, zi de zi,atta timp ct sistemul constant de cauze continu s opereze. Deci, se comport ca un sistem controlat de cauze, iar rezultatele lui pun n eviden stabilitatea, se spune c acest proces este ntr-o stare de control statistic. 3. conceptul de fenomen de mas presupune luarea n considerare a raportului dintre necesitate i ntmplare, dintre legea statistic (stohastic) i legea dinamic, dintre modelul stohastic i modelul determinist. Legea statistic (lege stochastica) nu poate fi cunoscut dect dac se ia n studiu un numr mare de cazuri individuale care sunt legate ntre ele datorit aciunii diferite a acelorai factori de influen. Legile statistice, spre deosebire de cele dinamice, se manifest sub form de tendin i sunt valabile pentru un ansamblu de uniti individuale. n esen, rolul statisticii este de a determina, pe baza datelor empirice, informaii ct mai precise asupra legii statistice de repartiie a formelor individuale ,ale fenomenelor de mas care ne intereseaz.

Legitile statistice, tendinele obiective de dezvoltare a fenomenelor de mas necesit depistarea tuturor cazurilor individuale, abstractizarea succesiv i eliminarea a tot ce este neesenial i ntmpltor n producerea fenomenelor. Aceasta nseamn c statistica studiaz fenomenele de mas din punct de vedere cantitativ i le interpreteaz ca fenomene probabile. Ele au un grad mare de variaie de la o unitate la alta chiar dac aparin aceleiai esene. Prin urmare, n cercetarea statistic este necesar s se in seama n mod obiectiv de principiile teoriei probabilitilor, de cerinele legii numerelor mari (formulat de J. Bernoulli n 1713). Aceast lege a statisticii arat c ntr-un numr suficient de mare de

cazuri individuale influenele factorilor se pot compensa n aa fel nct s ajung la o anumit valoare tipic pentru ntreg ansamblul. O alt particularitate a
obiectului de studiu al statisticii este aceea c aceasta studiaz fenomenele de mas din punct de vedere cantitativ n condiii specifice de timp, spaiu i organizare. Prin abordarea statistic a fenomenelor de mas se realizeaz trecerea de la datele individuale numeroase, amorfe, la un sistem de indicatori specifici unui ansamblu. Prin urmare, obiectul statisticii l reprezint studiul cantitativ al fenomenelor de mas n scopul cunoaterii legitilor lor de manifestare la nivelul ntregului ansamblu. Pentru atingerea acestui obiectiv statistica apeleaz att la metodele generale de abordare, ct i la numeroase metode specifice, pe care ea nsi le-a elaborat. Definindu-se ca tiina fenomenelor de mas, statistica privilegiaz raionamente de tip inductiv. Ea utilizeaz detaliul individual doar pentru a propune caracterizri de ansamblu. Metodele statistice sunt inductive prin natura lor, deoarece generalizrile rezult din observaii individuale. n plus, generalizrile deduse dintr-o investigaie statistic sunt adevrate doar n medie. Ele pun n eviden numai comportamentul tipic al tuturor obiectelor luate n studiu,dar nu descriu comportamentul elementelor luate separat, deoarece exist o stabilitate mai mare n colectivitate dect n individ1.

3. Semnificaii ale termenului de statistic Obiectul activitii de cercetare statistic presupune aciuni de proiectare i organizare, de culegere, prelucrare, analiz i interpretare a datelor statistice. n urma acestor operaii se obin informaiile necesare cunoaterii fenomenelor colective ce se manifest n diferite forme de manifestare. Activitatea statistic este structurat nu numai n
1

B. N. Gupta n AnIntroduction to Modern Statistics, Brokland Private Ltd., Calcutta,1962,p.10. 5

funcie de etapele demersului statistic, ci i n funcie de diviziunea social a muncii, de dezvoltarea sistemului informatic, de alte criterii. Din aceast cauz statistica se ntlnete ca disciplin tiinific i ca domeniu de activitate: statistica teoretic, statistica matematic, statistici de ramur (industrie, comer, agricultur, transporturietc.), statistica economiei naionale, statistica financiar i actuarial, statistica muncii , etc. n funcie de obiectivul urmrit, gradul de generalitate al concluziilor i de mijloacele utilizate, cercetarea statistic presupune dou faze: o faz descriptiv (exploratorie) = statistica descriptiv i o faz inferenial (decizional) = statistica inferenial (statistica matematic) Scopul principal i specific statisticii descriptive este acela de a sintetiza i structura ntr-o manier ct mai direct i mai intuitiv, datele de observaie i informaia coninut n acestea. n acest sens utilizeaz, de regul, tabele, grafice, indicatori numerici etc. Atunci cnd observarea s-a fcut prin cercetare selectiv (eantionare) statisticii descriptive i revine rolul de a pune n eviden proprietile eantionului i, pe aceast baz, de a sugera diverse ipoteze cu privire la o posibil extindere a concluziilor la nivelul ntregii populaii. Statistica descriptiv nu-i asum, ns, i rolul de a verifica valoarea de adevr a acestei ipoteze. Un asemenea studiu reclam explicit apelul la modelele probabilistice i, n consecin, face obiectul fazei infereniale a cercetrii statistice. Dac statistica descriptiv, din punctul de vedere menionat anterior,mai este denumit de unii autori statistica fr modele aleatoare, statisticii infereniale i revine rolul de a extinde rezultatele obinute pe baza datelor din eantion la nivelul populaiei generale i de a confirma sau invalida ipotezele emise a priori sau formulate dup faza exploratorie. Metodologia statisticii infereniale se bazeaz pe teoria probabilitilor i prezint caracteristici specifice cum ar fi: caracterul aleator al eantionrii; generalizarea concluziilor de la eantion la populaia statistic total prin marje specifice de incertitudine; recunoaterea explicit a nesiguranei prediciilor, deoarece incertitudinea implicat este msurat n mod obiectiv i este supus unui control statistic n limite ct mai strnse cu putin .Considerentele privitoare la raportul statistic descriptiv statistic inferenial prezentat anterior, sunt evideniate i n figura 1.

ambele faze avnd scop subordonat cunoaterii.

Figura 1.Raportul descriptiv inferen ial n cercetarea statistic

II. ELEMENTELE DEFINITORII ALE UNUI STUDIU STATISTIC

1. Populaie Populaie sau colectivitate statistic este o colecie de obiecte (entiti elementare,
indivizi), posednd toate o anumit caracteristic comun i care sunt supuse unui studiu statistic( reprezint totalitatea elementelor de aceeai natur, care au trsturi eseniale comune ) Colectivitatea statistic (sau populaia statistic) este o noiune fundamental a statisticii i reprezint principala form sub care se delimiteaz i se definesc fenomenele colective.Colectivitatea statistic este ntlnit i sub denumirea de populaie statistic sau pur i simplu populaie. Ea desemneaz totalitatea elementelor de aceeai natur care sunt supuse studiului statistic. Aceasta nseamn c o mulime de elemente formeaz o colectivitate statistic numai dac au aceeai natur, sunt asemntoare sau sunt omogene din punctul de vedere al anumitor criterii. Populaiile pot fi finite sau infinite; concrete sau abstracte Colectivitatea statistic se prezint ntr-o varietate de forme. Din acest motiv, una din problemele eseniale ale unei cercetri statistice o reprezint delimitarea colectivitii statistice n timp i spaiu, din punctul de vedere al coninutului i al formei de organizare. n funcie de natura unitilor, colectivitile statistice sunt alctuite dintr-un ansamblu de: persoane (populaia Romniei la recensmntul din 2011), obiecte (parcul de maini din unitile de turism din Romnia la o anumit dat), evenimente (cstoriile n cursul unei perioade; intrrile n contul unei societi comerciale ntr-un trimestru etc.), idei sau opinii (opiniile consumatorilor despre calitatea unor tipuri de mobil, maini de uz casnic etc.). De exemplu, dac dorim s studiem problema neparticiprii colare, atunci populaia va consta din totalitatea copiilor de vrst colar din Romnia. Dac ns obiectul studiului este gradul de poluare a localitailor urbane, atunci populaia va consta din toate oraele Romniei. n statistic aadar, cnd ne referim la populaie avem n vedere mulimea unitailor de analiz, indiferent ce reprezint acestea (coli, orae,ntreprinderi, ri, oameni sau chiar procese, fenomene i aciuni). Aceste exemple pun n eviden faptul c n statistic colectivitile statistice pot fi privite: static (cnd exprim o stare, un nivel la un moment dat ) i dinamic (cnd exprim un proces sau o devenire n timp). 8

Unitile colectivitii statistice sunt purttoare de informaii sau sunt subiectele logice ale informaiei statistice deoarece asupra lor se efectueaz nemijlocit observarea. Unitile colectivitii statistice exist la un moment dat. Unitile colectivitilor dinamice desemneaz evenimente, procese sau fluxuri i se produc n decursul timpului, se refer la perioada sau intervalul de timp n care se produc evenimente statistice. Unitile statistice sunt simple i complexe. Unitile simple reprezint elementele constitutive specifice naturii fenomenelor (de exemplu, persoana fizic, angajatul, produsul etc.) i care formeaz aceeai colectivitate. Unitile complexe sunt formate din mai multe uniti simple, organizate n funcie de criterii social-economice (de exemplu, ara,familie, echipa de lucru, grupe de studeni, unitatea economic etc.). inteligenta unui student, poate fi exprimat printr-un ansamblu de variabile.

2. Caracteristica statistic Caracteristica statistic sau atributul variabil: desemneaz nsuirea, proprietatea,
trstura comun unitilor unei colectiviti statistice, reinut n programul statistic pentru a fi nregistrat i care capt accepiuni sau valori diferite de la o unitate la alta sau de la un grup de uniti la altul. Exemple de caracteristici statistice pot fi: vrsta, greutatea, sexul, culoarea ochilor,numrul de infraciuni , statutul matrimonial, naionalitatea, ocupaia, cifra de afaceri, nivelul extrasului de cont etc. Caracteristicile statistice se mai numesc variabile statistice sau variabile aleatoare , deoarece au proprietatea de a-i modifica valoarea n timp i spaiu de la o unitate la alta. Asadar, o caracteristica studiata (de exemplu gradul de corupie ) ar putea fi reprezentat, direct sau indirect, prin mai multe variabile statistice Caracteristicile (variabilele) statistice pot fi clasificate n funcie de diferite criterii a) n funcie de variaia manifestat de caracteristici acestea pot fi cu variaie continu sau cu variaie discret (discontinu). Variabila discret ia numai valori ntregi (numrul persoanelor dintr-o familie, numrul de cauze soluionate de un judector , numrul de piese rebut dintr-un lot; numrul de turiti la o staiune de turism montan etc.).

Variabila continu poate lua orice valoare ntr-un interval finit sau infinit. ,adic , ntre dou valori succesive ale variabilei pot exista o infinitate de valori (greutatea,tonajul unui vas,cifra de afaceri). Datele discrete sunt rspunsuri numerice care apar n urma unui proces de numrare, n timp ce datele continue sunt rspunsuri numerice care apar n urma unui proces de msurare. b) Nivelul de msurare al variabilelor este un alt criteriu de clasificare a acestora, . Putem distinge ntre patru niveluri de msurare (nominal, ordinal, de interval i de raport), n funcie de trei criterii: posibilitatea de a ordona valorile variabilei, egalitatea intervalelor dintre valorile variabilei (sau altfel spus existena unei uniti de msur), existena unei "origini" a variabilei sau, cu alte cuvinte, a unui "zero absolut". 1. Nivelul de msurare nominal (de clasificare ) presupune clasificarea valorilor posibile ale caracteristicii n categorii care trebuie s fie distincte, mutual exclusive i exhaustive. Acest tip de variabile (respectiv scalele folosite n msurare) indic numai faptul c exist o diferen calitativ ntre categoriile studiate, nu i magnitudinea acestei diferene. La limit, putem privi aceste variabile ca pe nite tipologii. Cteva exemple de variabile msurate la nivel nominal sunt: statutul ocupaional al indivizilor (agricultor, salariat, mic ntreprinzator, omer etc.), religia (ortodox, romano-catolic, greco-catolic etc.) apartenena etnic (romn, maghiar, rrom etc.), mediul de reziden (rural, urban) , tip de infraciune economic,juridic,de alt natur .a.m.d.).

Valorile acestui tip de variabile nu pot fi ordonate, sau cu alte cuvinte nu exist o ierarhie (dect eventual conform unor criterii extrinseci) i n consecin problema "distanei" sau a intervalelor dintre valori nici nu poate fi pus. Numerele sunt atribuite observaiilor pentru a face doar judeci despre identiti sau diferenieri de categorie. Cu ajutorul scalei nominale numerele repartizate unor observaii servesc drept numele lor. Numerele sunt atribuite fiecrei categorii doar pentru a identifica uniti similare din interiorul unei categorii i pentru a diferenia aceste uniti similare de elementele unei alte categorii diferite. Se face, astfel, o difereniere de specie, dar nu i de grad. 10

2. Nivelul de masurare ordinal implic nu numai clasificarea elementelor n categorii ci i posibilitatea ordonrii acestora de la minim la maxim (existena tranzitivitii: dac a>b i b>c, atunci a>c). Totui, la acest nivel de msurare nu este oferit nici o informaie cu privire la "distana" dintre valorile scalei de msur. Cu alte cuvinte, diferena dintre prima valoare i cea de-a doua poate fi diferit de diferena dintre a patra i a cincea. Exemple de variabile msurate la nivel ordinal sunt calificativele colare (cu valorile "insuficient", "suficient", "bine" i "foarte bine"), satisfacia fa de anumite aspecte ce apar n chestionare (cu valorile "foarte nesatisfcut", "nesatisfcut", "satisfcut ) Unitile pot fi niruite una relativ cu cealalt i se poate realiza astfel, o ierarhizare, dar distana ntre numerele acordate nu este obligatoriu egal. Numerele pe scala ordinal nu reprezint intervale egale pe scala de msurare. 3. Msurarea la nivel de interval, ofer n plus fa de nivelul anterior (cel ordinal) i informaie referitoare la distana dintre valorile scalei i este caracterizat de existena unor intervale egale. Totui, la acest nivel de msurare nu exist un zero absolut, ci mai degrab unul convenional. Exemple de astfel de scale de msurare sunt temperatura msurat n grade Celsius (intervalele dintre valori sunt egale, dar punctul 0 este convenional ales ca fiind temperatura la care apa inghea), coeficientul de inteligen - IQ - (dac dou persoane au scoruri de 100 i respectiv 150, putem spune ca diferena dintre cei doi este de 50 de puncte, dar nu putem spune c cel de-al doilea este cu 1/2 mai inteligent dect primul sau c scorul 0 semnific absena inteligenei). Se face astfel posibil nu numai interpretarea ordinii notrilor pe scal, dar i a diferenelor dintre ele. 4. Msurarea la nivel de raport include toate caracteristicile nivelurilor anterioare (ordonare i intervale egale), plus existena unei "origini" sau zero absolut. Acest lucru permite formularea unor afirmaii n termeni de proporii (raporturi) ntre valori. De exemplu, vitezele de raspuns a doi subieci la un acelai stimul pot fi comparate n termeni de "timpul de rspuns a fost de dou ori mai mare" etc.. Exemple de variabile masurate la acest nivel sunt vrsta, greutatea, nlimea, distana, numrul de copii ) Corecta identificare a nivelului de msurare utilizat este foarte important n alegerea procedurilor statistice de analiz. Dup cum se poate observa din descrierea de mai sus, pentru fiecare nivel exista operaii matematice permise i operaii interzise. Astfel, la primul 11

nivel, cel nominal nu sunt permise nici ordonarea, nici operaii aritmetice (adunarea/scderea ,nmulirea/mprirea.) La nivelul ordinal este permis numai ordonarea, la cel de interval sunt permise n plus i operaiile de adunare/scdere, iar la ultimul nivel, cel de raport sunt permise toate operaiile. n funcie de nivelul de msurare, vom vorbi despre variabile msurate la nivel nominal, variabile msurate la nivel ordinal etc., sau, mai pe scurt, variabile nominale, ordinale, de interval i de raport. c) n funcie de modul de exprimare


variabile calitative (nivelurile nominal i ordinal) i variabile cantitative (interval i raport) Sunt caracteristici msurabile.. caracteristici alternative (binare sau dihotomice), acelea care pot lua doar dou variante de rspuns, dup modelul adevrat/fals din logic: sex (M/F), stagiul militar (efectuat/neefectuat), starea civil (cstorit/necstorit);

d) n funcie de numrul variantelor/valorilor de rspuns pe care le pot lua,

caracteristici nealternative cele care pot lua mai multe valori/variante de rspuns: salariu, profesie, cifr de afaceri, localitate de domiciliu etc.

3. Eantionul Eantionul este o submulime a populaiei analizate.


Cu ct este mai numeroas o colectivitate, cu att devine mai dificil cercetarea tuturor elementelor ei.. Soluia poate s fie, atunci, s extragem o subcolectivitate din colectivitatea general (numit i colectivitate parial, eantion sau colectivitate de selecie). Extragerea unui eantion din populaie este util i chiar necesar n condiiile n care resursele (financiare, de timp etc.) de care dispun iniiatorii studiului nu sunt suficiente pentru a asigura investigarea ntregii populaii. Eantionul reprezint un subset de elemente selectate aleatoriu dintr-o colectivitate statistic. n felul acesta, se vor estima parametrii colectivitii totale pe baza rezultatelor obinute n colectivitatea de selecie, iar ceea ce a fost determinat ca fiind tipic, esenial i caracteristic n eantion, se presupune c ar fi fost gsit dac s-ar fi cercetat colectivitatea general. Soliditatea acestei presupuneri depinde de modul cum a fost extras eantionul, iar de acurateea acestui proces depinde succesul demersului statistic. Reprezentativitatea

12

eantionului este, aadar, aspectul crucial al oricrui proces de cercetare pe baz de sondaj statistic. Exemplu :Dac s-ar dori s se studieze problema srciei n Romnia. n absena unui eantion, trebuie investigate peste 7 milioane de gospodrii, ceea ce ar duce la costuri financiare mari i la o extindere a timpului rezervat culegerii de informaii. n acelai timp, un subset din populaia analizat, extras conform unei scheme de eantionare riguroase, poate furniza toat informaia necesar la un nivel de acuratee foarte ridicat. Ratiunea eantionarii este limpede: prin efectuarea de studii asupra unei pari relativ mici din populatie s strngem suficient informatie care sa ne permita sa inferam la nivelul ntregii populaii asupra caracteristicilor studiate. Statistica ne permite prin tratamentul datelor obinute din grupuri mici de indivizi s extindem rezultatele la populatii mari. Numarul indivizilor din esantionul ales este numit volumul eantionului si este notat de obicei, atunci cnd ne referim la un esantion potential (esantionul nu a fost precizat) prin litera n. Eantionare subiectiv (exemple: selecia rocilor, pacieni pentru tratamente diferite) Un eantion simplu aleator este aadar selectat astfel nct: fiecare unitate statistic are o probabilitate egal de a fi aleas n eantion i unitile sunt alese independent, fr legtur una cu cealalt. Extragerea ntmpltoare a unitilor i alctuirea eantioanelor aleatoare se poate realiza prin unul din urmtoarele procedee de selecie: 1. metoda seleciei aleatoare (etichetarea tuturor indivizilor)

Procedeul urnei cu bile (procedeul loteriei), este un procedeu de selecie aleatoare care poate fi realizat n varianta cu revenire sau fr revenire. Se stabilete un cadru de identificare, astfel nct fiecare unitate din colectivitatea general este numerotat de la 1 la N. Numerele sunt notate pe cartonae, bileele sau bile iar acestea sunt amestecate atent. Se extrage apoi, la ntmplare, un cartona (bil) iar numrul citit identific unitatea ce este considerat ca fcnd parte din eantion. Pentru aceast unitate se nregistreaz toate caracteristicile ce fac parte din programul cercetrii. n continuare, n varianta cu revenire (sondaj repetat), cartonaul (bila) este reintrodus n urn, se repet amestecarea iar extragerea se repet pn cnd se obine eantionul de volum n. n varianta sondajului fr revenire (sondaj nerepetat), cartonaul are anse s mai reintre n colectivitatea de origine i s fie extras din nou. 13 (bila) nu este reintrodus n urn, ceea ce nseamn c o unitate statistic, o dat extras n eantion nu mai

2.

selecia sistematic (din k n k; periodiciti?)

Procedeul mecanic de selecie a eantionului presupune prelevarea unitilor din colectivitatea general dup un interval predeterminat, denumit frecvent pas de numrare aplicat bazei de sondaj. Pasul de numrare se calculeaz ca N/n=k Numrul iniial de la care se ncepe citirea se alege aleator ntre 1 i k, dup care se citete tot a k-a unitate pn la completarea eantionului de n uniti statistice. 3. selecia stratificat (proporiile straturilor)

Stratificarea const n divizarea colectivitii generale de studiat nstraturi, clase tipice ct mai omogene, cu caracteristici ct mai asemntoare, astfel nct unitile statistice din interiorul fiecrui strat s prezinte, cel puin din punct de vedere teoretic, caracteristici comune specifice fiecrei clase. Straturile pot fi constituite din regiuni, judee, localiti, medii, sexe, subdiviziuni economice, grupe de vrst etc. Cel mai frecvent, stratificarea se folosete n studiul populaiei care se separ folosind clasificrile oficiale sau, n funcie de scop, cercettorul i va face propria sa grupare, ca de exemplu, dup profesie sau vechimea n producie. 4. 5. selecia pe grupe: strzi, careuri de teren, circumscripii selecia ierarhic: aleator judee .> comune > strzi >persoane.

4. Observaiile Observaiile
Valorile nregistrate de aceeai caracteristic la unitile colectivitii statistice (populaie sau eantion ) se numesc observaii. Varianta/valoarea reprezint nivelul concret pe care l poate lua o variabil la nivelul unei uniti sau grup de uniti statistice. Frecvena de apariie a unei variante/valori reprezint numrul de apariii al acestei variante/valori n colectivitate. Datele statistice reprezint caracterizarea numeric obinut de statistic n legtur cu unitile, grupele sau colectivitatea studiat.Datele statistice sunt mrimi concrete, rezultate din studiile efectuate prin numrare, msurare sau calcul statistic. Ele pot fi primare, prelucrate, publicate sau stocate n baze sau bnci de date. Mesajul datelor statistice este informaia statistic. 14

Indicatorul statistic reprezint expresia numeric a unor fenomene, procese, activiti sau categorii economice i sociale, definite n timp, spaiu i structur organizatoric. Procesul cunoaterii statistice presupune organizarea i parcurgerea unor etape distincte i succesive care includ operaiile de observare sau culegere a datelor, de sistematizare i prelucrare, de analiz i interpretare a rezultatelor. Etapele cercetrii statistice sunt: observarea statistic etap n care se culeg date i informaii statistice de la unitile colectivitii, pentru toate caracteristicile urmrite; prelucrarea statistic etap n care datele sunt sistematizate i sunt calculai indicatorii statistici primari i derivai, absolui i sintetici ce caracterizeaz fenomenul studiat; analiza i interpretarea rezultatelor etap n care sunt verificate ipotezele, formulate concluziile i fundamentate procesele decizionale.

Prelucrarea statistic primar


Dup ce datele statistice au fost colectate din surse de date publicate, din observri totale sau din observri pariale ele trebuie organizate, n scopul de a avea o form care s permit prelucrarea lor statistic divers. Cel mai bun mod de a le examina este s le sistematizm i apoi s le prezentm n tabele i grafice. Putem atunci, s extragem cele mai importante trsturi, prin analiza seriilor i graficelor statistice. Principiile gruprii/clasificrii Sistematizarea datelor se realizeaz prin gruparea i clasificarea datelor statistice, adic prin mprirea lor n grupe/clase omogene, dup unul sau mai multe criterii de grupare/clasificare. O grup/clas este omogen dac unitile din interiorul ei tind s se asemene ct mai mult ntre ele din punctul de vedere al criteriului utilizat, adic dac ntre unitile din aceeai grup/clas exist variaii ct mai mici, datele. Dac sistematizarea datelor se face dup o variabil nenumeric, procesul se numete clasificare. Gruparea reprezint sistematizarea datelor dup o variabil (caracteristic) numeric. n funcie de tipul acesteia, gruparea se poate face dup o variabil discret sau continu. date de prezena factorilor aleatori, ntmpltori. Criteriul de grupare/clasificare reprezint variabila (caracteristica) statistic n funcie de care sistematizm

15

2.2. Prelucrarea primar cuprinde operaii de clasificri, de grupri, de comparri, de

prezentare sub form de tabele, grafice sau serii statistice. Datorit caracterului "ierarhic" i cumulativ al nivelurilor de msurare (de la multe restricii ctre nici o restricie n ceea ce privete operaiile permise, sau de la "calitativ" la "cantitativ"), vom putea ntotdeauna trata o variabil aflat la un nivel "superior" de msurare ca i cum ar fi fost msurat la un nivel "inferior". Atunci cnd avem de-a face cu un esantion mare (adic are un numr mare"de indivizi), de obicei variabilele numerice sunt nlocuite prin variabile calitative, ordinale (care reprezint aceeasi caracteristica). Mai precis, datele numerice sunt grupate ntr-un numar mic de clase. De exemplu, vrsta masurata n ani de via va putea oricnd fi tratat ca o variabil ordinal, dac i grupm valorile (sub 20, 2130, 31-50, peste 50). Niciodat ns nu vom putea trata o variabil aflat la un nivel "inferior" ca pe una aflat "mai sus" n ierarhie. (Cteodat, cercettorii fac excepie de la aceast regul, tratnd variabilele ordinale ca i cum ar fi msurate la nivel de interval. Totui, o dat cu dezvoltarea unor noi tehnici de analiz, dedicate special nivelelor de msurare "calitativ", aceste practici devin din ce n ce mai rare.)
Gruparea pe intervale de variaie Intervalul de variaie reprezint un ir de valori ale variabilei studiate, delimitat de intervalele vecine prin limita inferioar i limita superioar. Intervalele de variaie pot fi de mrime egal sau neegal. Pentru gruparea pe intervale de variaie se recomand utilizarea unui numr moderat de grupe. Deseori, un numr de 4 pn la 10 grupe este arbitrar recomandat, dar felul datelor poate necesita un alt numr de grupe.

Numarul K deintervale este ales n strns dependen de problema studiat. Un numr prea mic de intervale are dezavantajul c ascunde particularitile grupelor; din contra, un numr mare de intervale face dificil reprezentarea grafic a rezultatelor.i deducerea modelului probabilistic se face eronat . Pentru structurarea colectivitii, pentru evidenierea grupelor (straturilor) tipice din colectivitate, se pot forma grupri pe intervale egale de variaie sau pe intervale neegale. Gruparea datelor pe intervale de variaie necesit stabilirea numrului grupe(intervale) i a mrimii intervalelor. Nu exist o regul general valabil de determinare a numrului de grupe care trebuie s se formeze. Cu toate acestea, alegerea numrului de grupe nu se face mecanic, ci presupune cunoaterea variaiei caracteristicii numerice, elaborarea mai multor variante de grupe pn se ajunge la soluia cea mai potrivit, conform cu forma concret de manifestare a fenomenului urmrit. Scopul operaiei de grupare necesit formarea unui numr de grupe care 16 k de

s nu fie nici prea mare, dar nici prea mic. Cert este faptul c numrul de grupe (k) trebuie s fie direct proporional cu amplitudinea variaiei.

A = xmax - xmin , unde: xmin = min (x1, x2, ..., xn)


variaie (h) dup relaia i

xmax = max (x1, x2, ..., xn).

Pe baza amplitudinii i a numrului de grupe =k , se determin mrimea intervalelor de

h=A/k
n literatura de specialitate se recomand, n ipoteza repartiiei aproximativ normale a unitilor colectivitii dup caracteristica urmrit, utilizarea relaiei lui Sturges pentru determinarea mrimii intervalelor de variaie.

h =(xmax xmin)/(1+3,322 log10n)


Dup determinarea mrimii intervalelor de variaie este necesar s se determine limitele inferioare i superioare ale intervalelor de grupare. Stabilirea limitelor se poate face astfel: - limita superioar a fiecrui interval s se preia ca limit inferioar a intervalului urmtor. n felul acesta se obin intervale cu limit repetabil - limitele inferioare i superioare ale intervalelor de grupare distincte, difereniate printr-o unitate La repartizarea amplitudinii variaiei pe intervale de grupare trebuie s se in seama de urmtoarele recomandri: - limitele de interval s se exprime prin numere ntregi; - s se formeze un astfel de numr de intervale de grupare pentru a se obine informaii, suficient de analitice, n vederea caracterizrii colectivitii; - intervalele de grupare formate trebuie s permit, la nevoie, regruparea datelor fr s se reia operaia de grupare sau de divizare a intervalelor; - fiecare interval de grupare trebuie s cuprind un numr suficient de mare de valori individuale care s faciliteze analiza statistic a frecvenelor. n cazul n care se urmrete structura colectivitii (populaiei) simultan dup dou sau mai multe caracteristici numerice, sau n cazul n care se urmrete analiza modului de manifestare a interdependenelor dintre dou variabile, se elaboreaz gruparea combinat. Pentru elaborarea gruprii combinate este necesar ca intervalele de variaie fixate pentru o prim caracteristic (x) - de regul, caracteristica factorial, cauzal - s se divid n subgrupe dup o a doua caracteristic rezultativ (efect). Aceasta din urm la rndul lor sunt divizate n subsubgrupe dup o a treia caracteristic .a.m.d. Aceast caracterizare ierarhic adncete analiza structurii colectivitii, ea reprezentndu-se sub forma unui graf arborescent. 17

Serii statistice
Seriile statistice reprezint o alt modalitate de prezentare a datelor. Rezultatul sistematizrii
datelor prin grupare/clasificare se constituie sub forma seriilor statistice. Seria statistic este prezentarea ordonat a datelor referitoare la manifestrile unui fenomen colectiv sub forma a dou iruri de date: unul privete variabila i modul cum a fost sistematizat, iar al doilea frecvena de apariie sau nivelul unei variabile n raport cu primul ir.

Seria statistic, ca rezultat al sistematizrii i/sau gruprii, definete corespondena dintre dou iruri de date statistice n care primul reprezint variaia caracteristicii urmrite, iar al doilea ir cuprinde frecvenele de apariie a variantelor caracterisiticii.
1. Serii cronologice Seriile cronologice (de timp sau dinamice) prezint evoluia n timp a unui fenomen sau

descriu un anumit proces;


Seriile cronologice reprezint seriile statistice ce se obin prin sistematizarea datelor dup o variabil de timp. O serie cronologic este alctuit din dou iruri de date: unul cu privire la unitile de timp, care pot fi momente sau intervale de timp, iar cel de-al doilea cu privire la frecvena de apariie sau nivelul unui fenomen, nregistrat n aceste uniti de timp. Dac unitile de timp sunt momente, atunci seria cronologic se numete de stoc (de momente), iar dac unitile de timp sunt intervale (perioade), seria cronologic se numete de flux (de intervale).

Anul Infraciuni regimul circulaiei la

2002

2003

2004

2005

2006

22.998

21.537 22.405 24.904 20.309

Infraciuni la regimul circulaiei www.politiaromana.ro


2. Serii teritoriale Dac variabila pentru care se sistematizeaz datele este o variabil de spaiu (teritorial), adic elementul ce difereniaz manifestrile fenomenului analizat este locul unde acestea s-au produs, atunci rezultatul este o serie teritorial (de spaiu).
Regiunea de dezvoltare Nord Est Sud Est Sud Muntenia Sud Vest Oltenia Vest Nord Vest Centru Bucureti Ilfov

18

Persoane condamnate definitiv

12115

7735

7075

6715

5343

7375

6200

4147

www.insse.ro 3. Serii de distribuie de frecvene pentru o variabil atributiv n forma cea mai general o serie statistic cu o singur caracteristic x se prezint astfel:

x1 x2 ... x r. xn n1 n2 ... nr.. nn


Unde: x1, x2, ..., xn sunt variante nregistrate pentru caracteristica x

n1, n2, ..., nr sunt frecvenele de apariie ale variantelor caracteristicii x.


Infractiuni Infractiuni judiciare
75076

Infractiuni de natura
82222

economice
74339

alta

www.politiaromana.ro
Seriile de distribuie de frecvene alctuite dup o variabil cantitativ (numeric), poart numele de distribuii heterograde. Seriile de distribuie de frecvene alctuite dup o variabil calitativ (nenumeric) poart numele de distribuii homograde.

FRECVEN Frecvena unei observaii n eantion:este numrul de apariii ale acelei observaii (valori) n eantion. Frecvena relativ a unei observaii n eantion: raportul dintre numrul de apariii ale observaiei n eantion i numrul total de observaii(dimensiunea eantionului) Distribuia frecvenelor a) Distribuia frecvenelor ( pentru un atribut variabil discret): mulimea tuturor observaiilor distincte, mpreun cu frecvenele lor relative n eantion.

fumat Frecvena absolut Frecvena relativ

Intens 7149 0.433

Rar 2818 0.170

Nu 6563 0.397 16500 1.00

Total

b) Distribuia frecvenelor ( pentru un atribut variabil continuu ) Clas interval: un subinterval inclus ntre valorea minim i cea maxim. Frecvena clasei interval: numrul de observaii ce aparin clasei respective. 19

Distribuia frecvenelor unui atribut variabil continuu: mulimea claselor interval mpreun cu frecvena fiecreia.

Numar
0 1 2 3 4 5 6 7 8 9 10 total

mijlocul
0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5

Frecvena
1 4 7 3 4 3 2 1 1 2 1 29

frecvente relative
0.03 0.14 0.24 0.10 0.14 0.10 0.07 0.03 0.03 0.07 0.03 1.00

frecvente cumulate
1 5 12 15 19 22 24 25 26 28 29

amnri intervalului absolut

Forma general a seriei statistice conine informaii cu privire la succesiunea, mrimea valorilor nregistrate i a frecvenelor (absolute sau relative )corespunztoare; - ntre cele dou iruri de date exist o legtur univoc, n sensul c unei valori individuale oarecare i corespunde o anumit frecven, respectiv un numr care arat de cte ori se repet valoarea individual respectiv. Elaborarea seriilor i tabelelor statistice reprezint nu numai un mijloc eficient de prezentare a datelor statistice dar i o operaie premergtoare pentru reprezentarea grafic.

Reprezentarea grafic a distribuiei frecvenelor


Histograme: X axa valorilor; Y axa frecvenelor(absolute sau relative); 20

aria fiecrui dreptunghi proporional cu frecvena relativ respectiv.


histograma nr.aminari
0.30 0.25 frecvente relative 0.20 0.15 0.10 0.05 0.00 0 1 2 3 4 5 nr.am inari 6 7 8 9 10 frecvente relative

Figura 2. Histograma Poligonul frecvenelor: se unesc centrele laturilor superioare ale dreptunghiurilor din histogram.
poligonul frecventelor nr. aminari
0.30 0.25 frecvente relative 0.20 0.15 0.10 0.05 0.00 0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5 nr aminari histograma poligonul frecventelor

Figura 3. Histograma i poligonul frecvenelor Frecvene cumulate (ogiva): suma frecvenelor valorilor mai mici dect o valoare dat se aplic n special pentru variabile continue.

21

frecvente cumulate nr.aminari


35 30 frecvente absolute 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 9 10 nr aminari frecvente cumulate

Figura 4. Ogiva

22

III. TIPURI DE DIAGRAME n Microsoft Office Excel Diagramele transform datele n imagini. Diversele tipuri de diagrame pot transmite mesaje diferite pornind de la aceleai date. Serie de date: puncte de date nrudite care sunt reprezentate grafic ntr-o diagram. Fiecare serie de date dintr-o diagram are o culoare sau un model unic i este reprezentat n legenda diagramei. ntr-o diagram se pot reprezenta grafic una sau mai multe serii de date.

2004 Infraciuni judiciare Infraciuni economice Infraciuni alt natur de 82.222 74.339 75.076

2005 70.344 56.492

2006 82.359 59.85

2007 122.903 56.356

2008 124.815 55.871

81.403

90.45

102.198

108.645

volumul criminalitatii =infraciuni la 100.000 locuitori


1.006 961 1.077 1.305 1.344

http://www.politiaromana.ro/infractiuni_2002_2008.htm

Prin selectarea celui mai eficient tip de diagram datele vor deveni mai clare, mai puternice i mai informative. Microsoft Office Excel ofer o varietate larg de tipuri de diagrame i de metode simple pentru selectarea i examinarea acestora.

1. Diagrama Coloan
O diagram Coloan compar direct valorile ncepei prin selectarea datelor pe care le reprezentai pe diagram, precum i titlurile coloanelor i ale rndurilor. Apoi, pentru a deschide Expert diagram, facei clic pe butonul Expert diagram de pe bara de instrumente Standard.

Cnd se deschide expertul, avei selectat tipul de diagram Coloan. O diagram Coloan este un tip de diagram bun pentru compararea direct a valorilor. Cnd selectai un tip de diagram, este bine s o meninei simpl, astfel nct mesajul redat s fie clar. 23

Compararea tipurilor de infractiuni


140 120 numar infractiuni 100 80 60 40 20 0 2004 2005 2006 anii 2007 2008 Infrac iuni judiciare Infrac iuni economice Infrac iuni de alt natur

Figura 5. Diagram Coloan(datele pe coloan)

Compararea anilor pentru fiecare tip de infractiune


140 120 numar infractiuni 100 80 60 40 20 0 Infrac iuni judiciare Infrac iuni economice Infrac iuni de alt natur 2004 2005 2006 2007 2008

Figura 6. Diagram Coloan(datele pe linie)

2. Diagram Coloan stratificat


O diagram Coloan stratificat compar componente din mai multe totaluri Ce se ntmpl dac dorii s comparai contribuiile fiecrui tip de infraciune, la totalul anului? Avei posibilitatea s scoatei n eviden n mod diferit aceleai date prin crearea unui alt tip de diagram, Coloan stratificat. 24

Pentru a modifica din Coloan n Coloan stratificat, facei clic cu butonul din dreapta al mousului pe bordura diagramei pentru a o selecta, apoi facei clic pe Tip de diagram din meniul de comenzi rapide. (Alegem diagrama din figura 5)Se va deschide caseta de dialog Tip de diagram n care este selectat tipul de diagram Coloan. n partea dreapt a casetei de dialog, selectai din diferitele forme de diagrame Coloan prezentate n zona Subtip de diagram. Tipul de diagram se modific atunci cnd facei clic pe un subtip, apoi pe OK.
Compararea anilor dupa total infractiuni/an
350 300 numar infractiuni 250 200 150 100 50 0 2004 2005 2006 2007 2008 Infrac iuni de alt natur Infrac iuni economice Infrac iuni judiciare

Figura 7. Diagram Coloan stratificat

O diagram Coloan stratificat compar participrile diferitelor valori la un total, afind uniti sau procente.
Compararea anilor dupa evolutia fiecarui tip de infractiune
100% 80% 60% 40% 20% 0% 2004 2005 2006 2007 2008 Infrac iuni de alt natur Infrac iuni economice Infrac iuni judiciare

Figura 8. Diagram Coloan stratificat procentual .

numar infractiuni

25

Diagrama de aici este o diagram Coloan stratificat 100%, care afieaz participrile sub form de procente. Utilizarea subtipului Coloan stratificat sau a subtipului de baz Coloan grupat depinde de mesajul pe care dorii s-l clarificai; probabil c le-ai utiliza pe ambele. Fr s modificai diagrama, avei posibilitatea s ncercai caseta de dialog Tip de diagram pentru a vedea modul n care vor arta datele n diferite tipuri i subtipuri de diagrame. Selectai un tip i examinai-l executnd clic i meninnd apsat butonul Apsai i inei apsat pt. vizualizare eantion. Cnd tii exact ceea ce dorii, apsnd pe OK facei modificarea.

3. Diagram Structur radial


O Diagram de structur radial compar p r ile dintr-un total Ce se ntmpl dac dorii imaginea mare? Avei posibilitatea s creai o Diagram de structur radial. Aceasta este destinat prezentrii comparaiilor din cadrul unui singur set de valori i prezentrii modului n care componentele contribuie la ntreg.. Spre deosebire de o diagram Coloan, care poate s reprezinte un numr mare de valori, o Diagram de structur radial nu poate s afieze dect un singur set de valori Cum se obine o asemenea structur? n primul rnd, trebuie s selectai titlurile i totalurile coloanelor de pe foaia de lucru . Apoi facei clic pe butonul Expert diagram Diagramei de structur radial.
2002

de pe bara

de instrumente Standard pentru a deschide expertul, n care trebuie s selectai tipul

Infrac iuni judiciare 31% 33% Infrac iuni economice 36% Infrac iuni de alt natur

Figura 9. Diagram structur radial

26

Diagramele de structur radial sunt disponibile n numeroase subtipuri, precum 3-D, care are aspect vizual atractiv dar poate s fie mai dificil de neles dac are multe seciuni. Din nou, selectai forma de diagram care este cea mai eficient pentru reprezentare.

4. Diagram Linie
O diagram linie compar datele n timp Diagrama linie este un tip de diagram corespunztor pentru prezentarea modificrilor i a tendinelor n timp. Pentru aceasta, facei clic cu butonul din dreapta al mousului pe bordura diagramei pentru a o selecta, apoi facei clic pe Tip de diagram din meniul de comenzi rapide. Dup deschiderea casetei de dialog Tip de diagram, selectai o Diagram linie din lista Tip de diagram.
Compararea anilor dupa evolutia fiecarui tip de infractiune
140 120 numar infractiuni 100 80 60 40 20 0 2004 2005 2006 2007 2008 Infrac iuni judiciare Infrac iuni economice Infrac iuni de alt natur

Figura10. Diagram linie

Selectarea ntre o Diagram linie i o diagram XY prin puncte


Cnd deschidei Expert diagram sau caseta de dialog Tip de diagram, diagramele Linie i diagramele XY (prin puncte) arat similar n lista Tip de diagram. Este important s o selectai pe aceea care v ajut. Aici sunt cteva linii de ghidare care s v ajute n alegere. Diagramele Linie sunt bune pentru afiarea tendinelor n timp ale unor cifre de afaceri precum vnzri, venituri i profituri. Utilizai o Diagram linie dac dorii date n partea inferioar a diagramei, pentru a face dezvoltrile istorice vizibile dintr-o privire. Diagramele linie au de obicei un singur set de numere, prezentat pe axa vertical. O Diagram XY (prin puncte) compar odat dou seturi de numere, unul de pe axa orizontal X, altul de pe axa vertical Y. Valorile datelor sunt mprtiate n diagram. Avei opiunea s conectai valorile prin linii, dar aceste linii nu arat tendinele n timp. 27

evolutia in timp a volumului criminalitatii =infraciuni la 100.000 locuitori


1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 2003

infractiuni la 100000 locuitori

volumul criminalitatii =infrac iuni la 100.000 locuitori

2004

2005

2006 anii

2007

2008

2009

Figura11. Diagram XY (prin puncte) Diagramele XY (prin puncte) sunt bune pentru afiarea comparaiei de numere precum date tiinifice sau statistice, unde mai multe msurri trebuie reprezentate grafic pe o singur diagram. (de exemplu pentru a prezenta cte cazuri de infraciuni sunt pentru diferite grupe de vrst n funcie de veniturile medii ). O diagram XY (prin puncte)poate s fie un tip eficient de reprezentare a datelor. Pentru a aranja date ntr-o foaie de lucru pentru o diagram prin puncte, ar trebui s plasai valorile x ntr-un rnd sau coloan, apoi s introducei valorile y corespondente n rndurile sau coloanele adiacente.

Figura12. Diagram XY (prin puncte) Diagramele prin puncte au urmtoarele subtipuri de diagrame:

28

Prin puncte doar cu marcaje Acest tip de diagram compar perechi de valori. Utilizai o diagram prin puncte fr linii cnd avei date ntr-o anumit ordine.

Prin puncte cu linii fine i prin puncte cu linii fine i marcaje Acest tip de diagram poate fi afiat cu sau fr o curb fin care conecteaz punctele de date. Aceste linii pot fi afiate cu sau fr marcaje. Utilizai diagrama prin puncte fr marcaje dac exist multe puncte de date.

Prin puncte cu linii drepte i prin puncte cu linii drepte i marcaje Acest tip de diagram poate fi afiat cu sau fr linii drepte care conecteaz punctele de date. Aceste linii pot fi afiate cu sau fr marcaje.

Preluarea mai multor informa ii n diagrame


Utilizai dou tipuri de diagrame n cadrul unei diagrame pentru a crea o diagram combinaie. Uneori, un anumit tip de diagram este cel mai potrivit pentru o parte a datelor, dar pentru restul datelor este mai potrivit un alt tip de diagram. Nu trebuie s alegei dintre cele dou, deoarece Excel ofer posibilitatea combinrii a dou sau mai multe tipuri ntr-o singur diagram O diagram combinaie este uor de creat. n acest exemplu, trebuie s facei clic pe o coloan a infraciunilor de alt natur pentru a selecta toate coloanele acelei serii de date. Apoi trebuie s selectai un tip de Diagram linie din caseta de dialog Tip de diagram.
Compararea anilor dupa evolutia fiecarui tip de infractiune
140 120 numar infractiuni 100 80 60 40 20 0 2004 2005 2006 2007 2008 Infrac iuni judiciare Infrac iuni economice Infrac iuni de alt natur

Figura 13.Diagram combinaie (coloan cu linie)

O a doua ax prezint valori foarte diferite

29

Uneori diferitele seturi de date dintr-o diagram combinaie sunt att de diferite nct necesit ceva mai mult clarificare. Chiar dac sunt afiate diferit, nu avei posibilitatea s vedei valorile mai mici.
Compararea anilor dupa evolutia fiecarui tip de infractiune si adaugarea criminalitatii
140 120 numar infractiuni 100 80 60 40 20 0 2004 2005 2006 2007 2008 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 volumul criminalitatii =infrac iuni la 100.000 locuitori Infrac iuni de alt natur Infrac iuni economice Infrac iuni judiciare

Figura 14 Diagram combinaie cu dou axe Oy

Aceast problem se poate rezolva prin adugarea unei alte axe a diagramei, secundar. Prin reprezentarea valorilor criminalitii pe propria ax se uureaz nelegerea Diagramei linie, Pentru a crea o ax secundar, trebuie s selectai tipul de diagram pentru care dorii axa, apoi trebuie s efectuai cteva selecii n caseta de dialog Formatare serie de date.

O diagram care utilizeaz datele din list adaug automat informa iile noi
Exist o nou modalitate de a menine actualitatea diagramelor n Excel. Cnd modificai datele din foaia de lucru, Excel actualizeaz automat toate diagramele care utilizeaz datele. Dar ce se ntmpl dac adugai un ntreg rnd de date la o foaie de lucru? Diagrama nu se modific. Aceasta dac nu este o diagram care utilizeaz datele la care ai aplicat noua caracteristic List. Dac utilizai comanda List din meniul Date din Excel pentru a trece datele ntr-o list, apoi creai o diagram cu acele date, toate rndurile noi care au fost adugate n partea inferioar a listei sunt adugate automat la diagram.

30

5. Diagramele radar
Datele care sunt aranjate n coloane sau rnduri ntr-o foaie de lucru pot fi reprezentate ntr-o diagram radar. Diagramele radar compar valorile agregate ale unui numr de serii de date care indica evolutia in timp Diagramele de structur radial au numai o serie de date.
volumul criminalitatii =infrac iuni la 100.000 locuitori 2004 1.4 1.2 1 0.8 0.6 2008 0.4 0.2 0 2005

volumul criminalitatii =infrac iuni la 100.000 locuitori

2007

2006

Figura 15. Diagrama radar

Diagramele radar au urmtoarele subtipuri de diagrame:

Radar i radar cu marcaje Cu sau fr marcaje pentru punctele de date individuale, diagramele radar afieaz modificrile valorilor relativ la un punct central.

Radar plin ntr-o diagram radar plin, suprafaa acoperit de o serie de date este umplut cu o culoare.

6. Diagramele zon
Datele care sunt aranjate n coloane sau rnduri pot fi reprezentate ntr-o diagram zon. Diagramele zon accentueaz magnitudinea schimbrii n timp i pot fi utilizate pentru a atrage atenia asupra valorii totale n funcie de o tendin. De exemplu, datele care reprezint profitul n timp pot fi reprezentate ntr-o diagram zon pentru a accentua profitul total. Afind suma valorilor reprezentate, o diagram zon arat i relaia prilor cu ntregul. Diagramele zon au urmtoarele subtipuri de diagrame:

Zon i zon n 3-D Diagramele zon afieaz tendina valorilor n timp sau n categorii. O diagram zon n 3-D afieaz n acelai mod dar prezint zonele n 31

format 3-D. Pentru a prezenta datele n format 3-D, care utilizeaz trei axe (axele orizontal, vertical i adncime) ce pot fi modificate, ar trebui s utilizai subtipul de diagram zon 3-D.

Zon stratificat 100% i zon stratificat 100% n 3-D Diagramele zon stratificat 100% afieaz tendina procentului cu care contribuie fiecare valoare n timp sau n categorii. O diagram zon stratificat 100% n 3-D afieaz n acelai mod dar prezint zonele n format 3-D;

evolutia tipurilor de infractiuni in timp

150 100 50 Infrac iuni economice 0 2008 nr.infractiuni Infrac iuni de alt natur Infrac iuni economice 40% Infrac iuni judiciare

Infrac iuni de alt natur

Infrac iuni judiciare

2004

2005

2006 anii

2007

Figura 16. Diagrama zon n 3-D


evolutia tipurilor de infractiuni in timp
100%

80% nr.infractiuni

60%

20%

0% 2004

2005

2006 anii

2007

2008

Figura 17. Diagrama zon stratificat 100%

32

IV. STATISTICA DESCRIPTIV

1. Analiza seriilor statistice


Evaluarea anumitor indicatori (parametri) statistici implic stabilirea caracteristicilor (proprietilor) principale ale seriilor statistice. Acestea sunt: variabilitatea, omogenitatea, independena i concentrarea/mprtierea (dispersia) ctre/fa de un una sau mai multe valori ale seriei. Variabilitatea termenilor unei serii statistice este determinat de faptul c fenomenul pe care l reprezint nu este univoc determinat, ci apare ca un rezultat al aciunii combinate a mai multor cauze (permanente sau ntmpltoare). Cu ct aciunea cauzelor ntmpltoare este mai mare, cu att variabilitatea este mai mare i gradul de omogenitate mai mic. Omogenitatea presupune o variaie minim ntre termeni. Dac n urma analizei se constat c o serie nu prezint omogenitate, nseamn c n acest caz colectivitatea este format din mai multe tipuri calitative i seria trebuie descompus n subserii componente. Independena termenilor unei serii provine din faptul c fiecare valoare individual reprezint un element distinct i obiectiv al unei populaii statistice. Termenii ce aparin aceleiai colectiviti se supun acelorai legi care se manifest sub form de tendin. Concentrarea/mprtierea (dispersia) ctre/fa de un /una sau mai multe valori ale seriei apare ca rezultat al intensitii unui efect produs de cauze eseniale i ntmpltoare. Acest lucru determin frecvenele diferite de apariie a diferitelor valori din serie. Dac intensitatea factorilor este uniform, frecvenele de apariie sunt apropiate. n caz contrar, frecvenele de apariie se concentreaz fie la un singur capt al seriei, fie ctre o valoare central.

2. Statistici descriptive pentru un atribut cantitativ 2.1. Indicatorii tendinei centrale


n urma observrii caracteristicii cantitative X n n probe se obin urmtoarele date primare: x1, x2,..., xn (1)

33

Gruparea datelor se face n funcie de tipul caracteristicii X. Astfel, dac X este o variabil discret ce poate lua valorile distincte v1, v2 ,..., vn , atunci n locul datelor iniiale se va reine repartiia empiric:

v1.v2 ...vm n .n ...n 1 2 m

(2)

Unde ni, (i=1, m) reprezint frecvena apariiei (numrul de apariii) valorii vi, iar n reprezint numrul valorilor din irul iniial (1) i se numete frecven absolut a valorii v. Valoare m reprezint numrul de clase. Raportul fj =nj/n dintre frecvena absolut i numrul total de probe se numete
frecven relativ. Se observ c

f1 + f2 ++ fm =1 ntruct n1 +n2 + ... +nm = n. Frecvenele relative, numite impropriu i probabiliti de apariie, stau la baza calculrii densitii de repartiie a frecvenelor i a indicatorilor care exprim gradul de concentrare. De asemenea permit compararea a dou repartiii construite pe aceeai variabil, care difer numai prin numrul unitilor pe grupe. Atenuarea datelor, care accidental sunt prea mari sau prea mici dintr-o populaie statistic se face prin calcularea unor medii, n felul acesta fcndu-se o compensare a valorilor individuale. Acest calcul ne arat o anumit tendin a fenomenului studiat, media statistic fiind o valoare ce sintetizeaz ntr-o singur expresie numeric toate valorile din seria msurtori sau observaii. Termenii seriei difer de medie deoarece au fost influenai de diferii factori.
Media aritmetic

Media aritmetic simpl exprim un nivel mediu, anihilnd abaterile individuale, netipice. Ea este cuprins ntre valoraea cea mai mare i cea mai mic.
Definiia 1. Dac n urma unei selecii apar valorile distincte x1, x2,..., xn, atunci media

aritmetic este dat de formula:

x=

x1 + x2 + ... + xn 1 n = xi n n i =1

34

n cazul datelor centralizate (n care avem repartiia de frecven (2)):


n1v1 + n2 v2 + ... + nn vn 1 n = ni vi n n i =1

x=

care se mai numete medie aritmetic ponderat. Numrul care arat de cte ori se repet fiecare valoare (nj) este "ponderea" valorii respective.
Observaia 1. Media aritmetic are dezavantajul c este sensibil la valori extreme,

iar dac termenii sunt prea "mprtiai", tinde s devin o valoare nereprezentativ. Media aritmetic este o valoare lipsit de coninut dac elementele sunt deosebite din punct de vedere calitativ, caz n care este mai util s se fac medii pariale pentru fiecare tip de colectivitate.
Observaia 2. Dac avem mai multe medii, fiecare referindu-se la o anumit

categorie, fiecare medie va fi ponderat n funcie de importana categoriei sale.


Media geometric

Media geometric este mai puin sensibil la valorile extreme dect celelalte medii, deci se ntrebuineaz cnd dorim s atenum divergenele mari dintr-o serie de determinri cu frecvene egale, fiind dup o expresie "cea mai exact medie". Se utilizeaz cnd valorile au o evoluie (de cretere sau scdere) permanent, nentrerupt, sau o raie din ce n ce mai mare, termenii fiind legai ntre ei printr-o relaie de produs. De asemenea se mai ntrebuineaz cnd vrem s dm o importan mai mare termenilor mai mici, n valoare absolut, sau cnd diferenele ntre termeni sunt foarte mari. Are dezavantajul c nu se poate ntrebuina cnd avem valori nule sau negative.
Definiia 2. Dac x1, x2,..., xn sunt n valori, media geometric se definete prin

M g = n x1 x2 ...xn

Calculul se face mai uor cu ajutorul logaritmilor: 1 n lg xi n i =1

lg M g =

35

Datorit faptului c se calculeaz mai uor cu ajutorul logarimilor, se mai numete "medie logaritmic". Ea se utilizeaz i la calcularea ritmului (de cretere sau descretere) numindu-se astfel i "medie de ritm". n rezumat, se ntrebuineaz cnd: - seria are o mare dinamicitate; - termenii au variaii mari; - distribuia are un caracter pronunat de asimetrie.
Observaia 3. Media geometric se folosete atunci cnd prezint importan

variaiile relative. De asemenea media geometric poate fi folositoare pentru calculul unor rapoarte.
Media ptratica se ntrebuineaz cnd valorile prezint creteri din ce n ce mai

mari. Ea constituie modelul matematic pentru abaterea medie ptratic. Media este sensibil la valori extreme, din care cauz este ntotdeauna mai mare dect celelalte medii. Are avantajul c se poate aplica i n cazul valorilor nule sau negative (care prin ridicare la ptrat devin pozitive). Se ntrebuinzeaz cnd dm importan valorilor mari.
Definiia 3. Media ptratic este definit prin formula:
1 n 2 xi n i =1

x patr , s =

sau n cazul datelor centralizate (media ponerat): 1 n ni vi2 n i =1

x patr , p =

Media Armonic Definiia 4. Media armonic este valoarea invers a mediei aritmetice ale valorilor
inverse datelor de observaie:

Mh =

x
i =1

1
i

36

Exprim caracterul sintetic al unor valori ce se afl n raport invers. Se utilizeaz cnd frecvenele sunt egale. Pentru o repartiie de frecven, media armonic se folosete rar. Se utilizeaz cu predilecie n economie.

Media glisant numit i "medie mobil", se utilizeaz n cazul n care irul valorilor
prezint fluctuaii mari, brute i e greu de apreciat tendina (trendul). Se presupune c media glisant corespunde mijlocului intervalului sintetic. Calculul se face mediind 3 sau 5 valori alturate.

Definiia 5. Media glisant pentru 3, respectiv 5 valori alturate sunt date de formulele
xi 1 + xi + xi +1 3 xi 2 + xi 1 + xi + xi +1 + xi + 2 5

xglis ,3 = xglis ,5 =

Mediana Definiia 6. Mediana este elementul dintr-un ir de date statistice care ar mpri intervalul n
dou grupe egale ca numr, dup ce acestea au fost ordonate dup mrimea lor. Dac seria are 2n+1 elemente, atunci mediana este elementul n+1, iar dac are 2n elemente mediana este media aritmetic a celor doi termeni din mijloc.

2.2. Indicatorii variaiei


O medie este reprezentativ numai atunci cnd se calculeaz din valori omogene ntre ele. Cu ct fenomenele sunt mai complexe (dependente de mai multi factori), cu att variaia este mai mare i utilizarea mrimilor medii devine insuficient. De aceea este important de cunoscut ct de departe sunt valorile sumei statistice fa de medie. Comparaia se face cu media seriei, considerat ca fiind valoarea cea mai reprezentativ pentru populaia statistic. Analiza statistic a unei repartiii poate fi aprofundat prin calculul indicatorilor de variaie. Aceti indicatori trebuie s serveasc la: -verificarea reprezentativitii mediei ca valoare tipic a unei populaii statistice; -verificarea gradului de omogenitate a seriei; -caracterizarea statistic a formei i gradului de variaie a unui indicator; -cunoasterea gradului de influen a factorilor dup care s-a facut gruparea unitilor observate.

37

Indicatorii simpli ai variaiei


Indicatorii simpli ai variaiei servesc la caracterizarea gradului de mpratiere a mrimilor seriei statistice. Se pot exprima att n mrimi absolute ct i n mrimi relative. Din aceasta grup fac parte: -amplitudinea variaiei (absolut i relativ); -abaterile individuale (absolute i relative).

Amplitudinea absolut se calculeaza ca diferena dintre valoarea maxim i valoarea


minim al caracteristicii: Aa = xmax xmin

Amplitudinea relativ se exprima de regul n procente i se calculeaz ca un raport ntre


amplitudinea absolut i media aritmetic: Ar =

Aa 100 x

Abaterile individuale absolute (di) se calculeaz ca diferena ntre fiecare valoare i media

aritmetic: di = xi - x , i = 1,...,n
Abaterile individuale relative (dr) se calculeaz ca raportul dintre abaterile individuale

absolute i media aritmetic (se exprima n procente): dr =


di x 100 , i = 1,...,n Gradul de variaie al unei caracteristici depinde de toate abaterile variantelor nregistrate i de frecvena lor de apariie i prin urmare indicatorii simpli ai variaiei nu pot exprima ntreaga variaie a unei populaii statistice. De aceea a fost necesar introducerea indicatorilor sintetici ai variaiei.

Indicatorii sintetici ai variaiei


Indicatorii sintetici ai variaiei, la fel ca i indicatorii tendintei centrale trebuie s se bazeze pe toate observaiile, sa fie uor de calculat, uor de nteles i s fie ct mai puin afectai de fluctuaiile de selecie. Indicatorii sintetici ai variaiei sunt: -abaterea medie liniar ; -abaterea medie patratic; -dispersia; -coeficientul de variaie.
38

Abaterea medie liniar se calculeaz ca o medie aritmetic simpl sau ponderat,

luate n valoare absolut: Pentru o serie simpl


n

d =

| x x |
i =1 i

Abaterea medie liniar prezint dezavantajul c nu ine seama de faptul c abaterile mai mari n valoare absolut influenteaz n mai mare masur gradul de variaie a unei caracteristici, n comparaie cu abaterile mici. n plus, nu este indicat s se renune n mod arbitrar la semnul valorilor din care se calculeaz o valoare medie. Din aceste considerente se folosete ca principal indicator sintetic al variaiei abaterea medie patratic.
Abaterea medie patratic sau abaterea standard () se calculeaz ca o medie

patratic din abaterile tuturor elementelor seriei de la media lor aritmetic:

(x
i =1

x)2

Acest indicator este mai concludent dect abaterea medie liniar. Prin ridicarea la ptrat se d o importan mai mare abaterilor mari n valoare absolut, acestea influennd ntr-o msura mai mare gradul de variaie al variabilelor analizate. n literatura de specialitate se apreciaz ca pentru o serie de distribuie normal abaterea medie liniar este egal cu 4/5 din valoarea abaterii medii ptratice. Abaterea medie ptratic este un indicator de baz, care se folosete la analiza variaiei, la estimarea erorilor de selecie n calculul de corelaie. La fel ca abaterea medie liniar, abaterea medie ptratic se exprim n unitatea de masur a variabilei a crei variaie o caracterizeaz. Prin urmare cei doi indicatori nu se pot folosi pentru compararea gradului de variaie i n aceasta situaie se recurge la un alt indicator de variaie: coeficientul de variaie.

Coeficientul de variaie (v) se calculeaza ca un raport ntre abaterea medie ptratic


i media aritmetic. De obicei se exprim sub form de procente: v=

100

Semnificaie. Cu ct valoarea lui v este mai aproape de zero cu att variaia este mai slab, colectivitatea este mai omogen, media avnd un grad ridicat de reprezentativitate. Cu ct

39

valoarea lui v este mai mare cu att variaia este mai intens, colectivitatea este mai eterogen, iar media are un nivel de semnificaie sczut. Se apreciaz c la un coeficient de peste 35-40%, media nu mai este reprezentativ i datele trebuie separate n serii de componente, pe grupe, n funcie de variaia unei alte caracteristici de grupare. Se poate afirma c acest indicator poate fi folosit ca un test n aplicarea metodei gruprii. Dac media aritmetic este aproape de zero, coeficientul de variaie nu are semnificaie.

Dispersia ( 2 ) este media ptratelor abaterilor de la media aritmetic:

2 =

2 1 xi x . n

Msura dispersiei se refer la mprtierea valorilor dintr-un set de date. Media nu are semnificaie dac se aplic pe un set de date foarte dispersate. De exemplu dac lum valoarea medie a oraelor mari (peste 200.000 locuitori) va da o valoare de peste 400.000 datorit Bucuretiului care are 2.000.000. ns rezultatul nu are nici o semnificaie (nici un ora nu avea aceast valoare). Msurile dispersiei, exprimate sub forma unitilor de msur ale fenomenului cercetat, nu sunt ntotdeauna utile atunci cnd se compar dispersiile a dou sau mai multe serii. Compararea dispersiilor a dou sau mai multe serii d rezultate n urmtoarele 2 situaii: a) irurile care se compar pot fi exprimate n aceleai uniti, iar mediile pot fi aceleai sau au dimensiuni aproape egale. b) irurile care se compar pot fi exprimate n aceleai uniti, ns mediile difer. Dac seriile se exprim n uniti diferite, dispersiile nu pot fi comparate direct. De aceea de multe ori se folosete abaterea medie ptratic n loc de dispersie. n unele lucrri aceast mrime se numete varian (engleza :. variance). Variana este o msur important n special cnd se studiaz variaia a dou sau mai multe eantioane. O tehnic statistic foarte puternic este cunoscut sub numele de analiza de varian i utilizeaz dispersia pentru a decide dac un numr de eantioane difer semnificativ unul de altul.

40

2.3. Indicatori de asimetrie si aplatizare(Skewness i kurtosis)


Skewness
Abaterea medie ptratic i dispersia sunt indicatori care dau o msur a mprtierii valorilor ntr-o distribuie de frecven. ntr-un anume sens ele ofer o msur a limii distribuiei. Aceasta ns nu ofer nici o informaie privind caracteristicile formei distribuiei de frecven. Figura de mai jos nfieaz 6 distribuii utiliznd histograma. Aceasta reprezint un set de date care au acelai numr de valori. Pe orizontal avem o unitate de msur exprimat n abateri medii patratice (), iar pe vertical avem media aritmetic. Dup cum se observ, se poate face o comparaie direct.

Aparent cele ase distribuii de frecven sunt foarte diferite. Cele din partea dreapt (b, d, i f) sunt similare dintr-un singur punct de vedere, anume ele sunt asimetrice, vrful este plasat n stnga sau dreapta mediei. Spunem c avem o distribuie distorsionat sau asimetric (skewed). Cele din stnga (a, c, e) au un grad mic de distorsiune (asimetrie). n toate cazurile vrful este n apropierea mediei. Toate acestea sunt distribuite simetric. Pe de alt parte cele dou distribuii de pe fiecare rnd pot fi considerate similare, n sensul c au un anumit grad de ascuire sau kurtosis. Cele din primul rnd sunt foarte ascuite; ele au aceleai grad de kurtosis. Cele din al doilea rnd au ascuimea mai moderat, iar cele din al treilea rnd sunt relative plate. 41

Distorsiunea msoar, deci, volumul de valori din distribuia concentrat de o parte i de alta a mediei. Dac acest volum de valori este mai mic dect media, spunem c distribuia este pozitiv distorsionat (b). Dac exist mai multe valori mai mari dect media, spunem c distribuia este negativ distorsionat (d).

Exemplu in Excel :

Introducei urmtoarele date de la adressa www.insse.ro :

Dup ce introducei coninutul unei celule, validai acest fapt cu [Enter] sau [Tab].

2.Pentru a edita coninutul unei celule folosii tasta [F2] sau dublu click. Pentru formatarea celulelor selectai domeniul dorit. Alegei din meniu comanda Format - Cells - Alignment i selectai opiunea Center din caseta derulant pentru aliniere n centrul celulei, selectai opiunea Merge text pentru reuniunea mai multor celule, selectai opiunea Wrap text pentru spargerea textului pe mai multe rnduri.(de ex. Celula B1)
42

4. Pentru formatare selectai domeniul dorit. Alegei din meniu comanda Format - Cells - Border i selectai tipul de linie dorit pentru ncadrarea celulei sau domeniului selectat, apoi apsai butonul pentru tipul de ncadrare dorit.

3. Pentru a calcula numrul total de cauze n celula B17: se face clic pe B17 i se introduce formula =SUM(B2:B16) sau se face clic pe butonul

43

4. Pentru calculul frecvenelor relative n celulele C2:C16: se nscrie n C2 formula pentru anul 1990=B2/$B$17 , n care absolut=total general nr.cauze Pentru calcularea formulei i n pentru ceilali ani fie prindem cursorul de umplere i tragem n josul coloanei pn la C16 sau executm operaia Fill astfel: selectm domeniul de la C3 la C16; din meniul Edit alegem opiunea Fill Down. B2 referin relativ=nr. cauze 1990 iar $B$17 referin

44

Tot domeniul selectat se va completa cu formula calculat n celula C2. Referina relativ B2 va varia de la B2 la B16, iar referina absolut $B$17 va rmne neschimbat 4. Pentru ca frecvenele relative s fie exprimate n procente selectm domeniul dup care din meniul FormatFormat cellsNumberPercentage

45

Pentru a micora numrul de zecimale apsai pe butonul


5.Pentru a obine evoluia temporal a numrului de cauze soluionate se urmeaz operaiile:
Se selecteaz domeniul C1:C16 Se alege din meniul InsertChart dup care se urmeaz paii din Chart Wizard

46

Pentru calcularea parametrilor statisticii descriptive Excel ofer mai multe moduri: prin calcularea funciilor, un mod simplu i mai rapid: pachetul de calcule statistice

Data Analysis Tool oferit de Excel opiunea Descriptive Statistics, tabelul pivot
pentru calculul statisticilor descriptive pe subgrupuri de date. Se pot calcula urmtorii parametrii: sum, medie aritmetic, modul, minim, maxim, deviaie standard, variaie, eroare standard, kurtosis, skewness, interval de confiden, al k-lea element mai mic sau mai mare, talia, i intervalul. Toi aceti parametrii se pot calcula pentru una sau mai multe variabile. Vom rezolva aceast problem cu ajutorul componentei Data Analysis Descriptive Statistics: 1. Pentru a folosi pachetul Data Analysis el trebuie instalat. Pentru aceasta verificai dac nu a fost instalat deja: deschidei meniul Tools. Dac opiunea Data Analysis este prezent, atunci se trece la pasul urmtor. Dac opiunea Data Analysis nu este prezent, atunci din meniul Tools se alege opiunea Add-Ins. Va aprea o fereastr asemntoare celei de mai jos n care se va bifa prima opiune Analysis ToolPak. Apsai butonul Ok.

47

2. Alegei opiunea Data Analysis din meniul Tools. Din fereastra de dialog care apare selectm Descriptive Statistics. Clic pe OK.

3. Dup apsarea butonului OK pe ecran va aprea urmtoarea fereastr de dialog: Urmeaz o descriere a cmpurilor ferestrei de dialog de mai sus:

48

4. Input Range: Introducei referinele domeniului unde se gsete variabila pentru care dorim s calculm parametrii statisticii descriptive. n cazul nostru B1:B16. Pentru introducere executai click n cmpul Input Range, apoi click n celula B1 i executai o selecie pn n celula B16. 5. Grouped by: se va selecta Columns dac fiecare variabil este introdus ntr-o coloan sau Rows dac fiecare variabil este introdus ntr-o linie. n cazul nostru vom bifa Columns. 6. Labels in first row. Antetul de coloan sau linie poate s fie selectat sau poate lipsi. Dac selectm i antetul de coloan, atunci n pagina de rezultate va aprea acel antet, adic numele variabilei. In acest caz trebuie s bifm Labels in first row. Dac nu bifm funcia va ntoarce eroarea: Input range contents non numeric data, deoarece se consider i antetul de coloan ca fiind una dintre valorile variabilei. In cazul n care nu selectm antetul de coloan, ar trebui s nu bifm nici Labels in first row. Dac bifm Labels in first row atunci prima valoare a variabilei va fi luat drept antet de coloan i rezultatele vor fi greite. In cazul nostru selectm labels in first

row.
7. Opiunile Output se refer la locul amplasrii tabelului de frecven. Dac vom selecta opiunea New Worksheet Ply,tabelul de frecven va fi afiat la o pagin nou al crei nume trebuie introdus n cmpul New Worksheet Ply. Output Range este pentru cazul n care dorim ca rezultatul s fie afiat pe aceeai pagin cu tabelul ncepnd cu o anumit celul care trebuie introdus n cmpul Output Range.( n

49

cazul nostru C1)New Woorkbook se bifeaz n cazul n care dorim ca rezultatul s fie afiat ntr-un alt fiier. Cel puin una dintre urmtoarele opiuni trebuie selectate. 8. Summary statistics se bifeaz pentru ca s se calculeze statisticile principale. 9. Confidence Level for Mean se bifeaz pentru a se calcula i semi- lungimea intervalului de ncredere pentru media populaiei. Nivelul de confiden implicit este 95%, se poate schimba cu un alt numr de la 1 la 99,9. 10. Kth Largest ntoarce numrul al k-lea mai mic dect numrul cel mai mare. K este o constant care se introduce n cmpul corespunztor. Clic pe Kth Largest. Introducei numrul 2 n cmpul Kth Largest. 11. Kth Smallest ntoarce numrul al k-lea mai mare dect numrul cel mai mic. K este o constant care se introduce n cmpul corespunztor. Poate fi diferit de K de la punctul 10. Clic pe Kth Smallest. Introducei numrul 2 n cmpul Kth Smallest. 12. Click OK.

13. Interpretarea rezultatelor 50

Mean n medie s-au soluionat 458 de cauze. de ctre un judector

ES =
Standard Error Eroarea standard calculat dup formula:
este deviaia standard i n numrul de observaii.

S n , unde S

Median Mediana este o valoare a seriei astfel nct jumtate dintre observaii
au valori mai mici (sau egale) i cealalt jumtate au valori mai mari (sau egale). Dac n este impar, atunci mediana este dat prin formula:
X n +1
2

Me =

Dac n este par, atunci mediana este dat prin formula:

Xn + Xn
2 2

+1

Me =

Mode Modulul este valoarea care are cea mai mare frecven din serie. In
cazul modulului o situaie care apare este cea n care seria nu are modul, adic toate valorile apar o singur dat. Atunci va fi afiat valoarea #N/A. O alt situaie posibil este ca seria s fie bimodal sau trimodal. Atunci va fi afiat numai prima valoare n ordinea apariiei lor n cadrul seriei. In acest caz pentru determinarea tuturor valorilor modulului se poate face un tabel de frecven.

Standard Deviation Deviaia standard sau Abaterea standard S =


s2 este variatia.

s 2 . Unde

Sample Variance Variaia este calculat dup formula:


unde n este talia seriei,

s2 =

(X
i =1

X )2

X i , i = 1, n seria de date, n cazul nostru ,numrul de cauze

soluionate i X este media aritmetic a seriei.

Kurtosis Excesul sau Boltirea msoar nlimea aplatizrii sau boltirii unei
distribuii n comparaie cu o distribuie normal. Aceast msur este definit prin: 51

1 n (X i X )4 n i =1 3 S4 . 4=

Excesul

este zero pentru o serie de date avnd o distribuie normal, este

pozitiv pentru o serie de date avnd forma mai nalt dect cea a unei distribuii normale (cu media X i variaia S2) i este negativ pentru o serie de date a crei form este mai cobort dect cea a unei distribuii normale. In cazul nostru valoarea -0,669 a boltirii indic o curb puin mai aplatizat dect curba normal.

Skewness Asimetria msoar abaterea de la aspectul simetric i direcia


asimetriei (pozitiv sau negativ) fa de curba normal. Este calculat cu formula:

3 =

[( X
i =1

X ) / S ]3 n

Asimetria este 0 pentru o serie de date avnd o distribuie normal, este pozitiv pentru o serie de date asimetric spre stnga (seria are mai multe valori mai mici), este negativ pentru o serie de date asimetric spre dreapta (seria are mai multe valori mai mari). In cazul nostru asimetria este 0,198, deci este puin deplasat la dreapta fa de curba normal.

Range Intervalul este Maximul-Minimul. Maximul este 678, iar minmul este
390 Range=678-390=288

Minimum Minimul valoarea cea mai mic din serie. Maximum Maximul valoarea cea mai mare din serie.

Sum Suma sau Totalul valorilor seriei: Count Numrul de observaii n=15.

X
i =1

, unde

X i , i = 1, n seria de date.

Largest(2) - Numrul al k-lea mai mic dect numrul cel mai mare. Smallest(2) - Numrul al k-lea mai mare dect numrul cel mai mic.
52

Confidence Level (95,0%) ntoarce o valoare cu ajutorul creia se poate


construi intervalul de confiden de 95% pentru media populaiei. Aceast valoare este 42.23 intervalul este =[ X -42.23, X +42.23] = [], unde X este media aritmetic a eantionului. Fie m media populaiei situat n acest interval. Media oricrui eantion al acestei populaii este mai departe de m ca X cu o probabilitate mai mare dect alpha. Alpha n cazul nostru este 5%. Presupunem c utilizm X , deviaia standard standard i talia pentru a construi un test cu un prag de semnificaie alpha n ipoteza c media populaiei este m. Nu vom respinge ipoteza dac m este n intervalul de confiden i vom respinge ipoteza dac m nu este n intervalul de confiden. Dac alpha este 0,95 trebuie s calculm aria de sub curba normal. Aceast valoare este 1,96. Intervalul de confiden este:

[ X tcrit ES , X + tcrit ES ] , unde X este media aritmetic, iar E este eroarea S


standard, iar t critic este 1,96. Valoarea ntoars de program este tcrit ES . Se poate calcula i cu funcia CONFIDENCE.

53

V. LEGTURILE DINTRE FENOMENELE COLECTIVE


Statistica studiaz legturile cauzale dintre fenomenele colective. Legile naturale

mbrac ntotdeauna forma enunrii unei legturi fie ntre manifestrile a dou sau mai multor fenomene, fie ntre prezena i absena anumitor caractere Spunem, de exemplu, c electricitile de sens contrar se atrag, iar cele de acelai sens se resping, c temperatura descrete odat cu creterea altitudinii, c infracionalitatea crete dac scade nivelul de trai Acestea sunt legi cunoscute. Prima este o lege rigid, se verific, prin urmare, aplicat oricrui caz. Celelalte sunt legi stochastice.. Forma sub care am enunat legea stochastic de mai sus const numai n existena legturii dintre fenomene i prin aceasta suntem privai de cunoaterea unui element destul de interesant n aceast direcie: gradul de asociaie ntre cele dou fenomene sau
caractere.

Prezentul capitol este consacrat mijloacelor de care dispune statistica matematic pentru a msura acestui nou element. Este clar c o definiie perfect circumscris a gradului de legtur ntre dou variabile nu poate fi atins. n procesul de cercetare a legturilor cauzale existente ntre fenomenele naturale avem de-a face cu contopirea aciunilor unei multitudini de factori (cauze), dintre care unii eseniali, alii neeseniali, unii pot fi determinai, alii nu. Tocmai de aceea, n cercetarea legturii reciproce dintre dou fenomene apar dificulti mari deoarece pot s existe cauze necunoscute. n astfel de situaii este util s determinm gradul de corelare i apoi s analizm separat unele din aceste cauze. Cu alte cuvinte, trebuie s definim relaii posibile ntre diferii factori, evenimente, atribute sau caracteristici care ar putea avea o influen, cel puin parial asupra datelor experimentale. n acest mod este posibil stabilirea unui tablou al condiiilor n care se desfoar un anumit fenomen natural, fapt care duce la modelarea matematic a sa. Din aceast cauz, diferite puncte de vedere au putut sta alturi pe aceast chestiune, fr ca s se decid care este cel mai adecvat. i natural, fiecare din ele a condus la un mijloc diferit de msur a acestei legturi. n multe procese naturale, pe lng complexa ntreptrundere cu alte fenomene (procese), acestea mai sunt supuse unor evoluii care la prima vedere pot fi considerate probabiliste (aleatoare). De aceea, pentru cunoaterea modului de evoluie probabil n viitor - prognoza unui anumit fenomen - trebuie s ne bazm pe cunoaterea evoluiei trecute, precum i pe situaia prezent. Experiena unui mare numr de observaii (probe) au dus la concluzia c ntre diferitele mrimi variabile pot exista urmtoarele tipuri de relaii: 54

a) Relaia de dependen, Y depinde de X sau invers. O modificare a unei variabile duce la o modificare a celei de-a doua. n cazul unei astfel de relaii s-ar putea aminti existena relaiei cauzale n care o variabil este cauza, iar cealalt este efectul, cauza fiind un fenomen sau un complex de fenomene care provoac, genereaz sau determin un alt fenomen - efectul. Operaia logic prin care efectul este dedus din cauz se numete inferen

cauzal.
b) Relaia de interdependen, Y depinde de X i X depinde de Y. n acest caz modificarea unei variabile provoac modificarea celei de-a doua variabile, iar modificarea acesteia din urm are influen asupra primei variabile. c) Relaia de tranziie, X se transform parial sau total n Y i invers. d) Corelaia statistic sau covariana. Pentru X exist ntotdeauna Y i invers. Este o relaie reciproc dintre dou variabile, dintre care una n mod logic apeleaz la alta i pe baza analizei datelor experimentale se poate pune n eviden o asociere ntre ele. e) Relaia stochastic; dac se realizeaz X atunci cu o anumit probabilitate se realizeaz i Y, sau invers. Datorit caracterului complex al fenomenelor i datorit multitudinii de factori eseniali i ntmpltori care intervin, aceste legturi se manifest sub form de tendin; ele pot fi identificate n condiiile aciunii legii numerelor mari, n colectivitile de volum ridicat. O problem important n cadrul analizei seriilor interdependente o reprezint

identificarea legturilor cu adevrat semnificative i stabile.


n cazul n care s-a stabilit c ntre dou variabile exist un raport de dependen, se ridic o alt problem, mult mai dificil: gsirea unei msuri a acestei legturi, prin intermediul unui indicator sintetic de corelaie. Exist ns i situaii neltoare, n care variaiile (creterea sau scderea) celor dou fenomene aparent interdependente sunt similare, dar nu exist nici o legtur logic ntre

ele. De exemplu, n ultimii ani n Romnia cresc simultan att rata srciei, ct i nzestrarea
populaiei cu telefoane mobile. Alteori explicaia tendinei de asociere a celor dou variabile este dat de existena unei cauze comune. De exemplu, creterea simultan i semnificativ a vnzrilor la pulovere de ln i la medicamente antigripale are aceeai cauz: venirea iernii. Analiza calitativ a datelor statistice rezolv probleme de acest tip.

55

1. SERIILE INTERDEPENDENTE 1.1. Tipuri de legturi


Analiza seriilor interdependente urmrete 1. verificarea existenei i

2. msurarea intensitii legturilor dintre fenomene.


Cu ct fenomenele sunt mai complexe, cu att numrul factorilor care le influeneaz este mai mare, ceea ce face legturile cauzale dificil de evideniat. Analiza dependenelor se complic atunci cnd factorii de influen intercondiioneaz determinnd apariia de cauzaliti n lan. Pentru a putea determina intensitatea relaiilor de corelaie, este necesar s se analizeze, n primul rnd, coninutul i forma acestor relaii. Vom nota cu:

y fenomenul a crui variaie este influenat (variabil dependent sau rezultativ)


i cu

x factorul de influen (variabila independent sau factorial).


Dup natura legturilor de interdependen deosebim dou categorii de relaii:

a) funcionale (deterministe) i
b) stochastice (statistice). a) Funcionale: y = f (x). Fenomenul cauz x determin n mod univoc fenomenul efect y, astfel nct
unei valori a variabilei x i corespunde o valoare unic a variabilei y..

b) Stochastice: y = f (x1 , x2 ,..., xn).


Fenomenul efect este influenat de o multitudine de factori,

eseniali i

ntmpltori. Unei valori a fenomenului cauz xi i pot corespunde mai multe


valori diferite ale fenomenului efect y, n funcie de aciunea combinat a celorlali factori de influen. De exemplu, infracionalitatea unei persoane

depinde de: profilul psihologic,sex, gradul de educaie, gradul de srcie, situaia familial, starea de sntate etc. Fiecare caracteristic xi determin numai o parte a variaiei fenomenului y, restul variaiei fiind explicat prin alte caracteristici, care din punct de vedere al legturii xi -y sunt ntmpltoare.

56

Variaia fenomenului y poate fi analizat n funcie de unul sau mai muli factori de influen (x1, x2,... , xn), dar ntotdeauna va rmne o variaie neexplicat, determinat de factorii nenregistrai. n cazul n care se identific i se analizeaz factorii de influen eseniali, componenta aleatoare, care sintetizeaz aciunea factorilor ntmpltori, va avea o pondere redus i nu va influena semnificativ veridicitatea rezultatelor. Legturile stochastice sunt specifice fenomenelor din societate i economie. Extrema diversitate a legturilor stochastice impune sistematizarea lor dup mai multe criterii. Dup numrul caracteristicilor analizate, legturile stochastice pot fi simple sau multiple.

a) Legturi simple - se alege o singur caracteristic determinant pentru variaia


fenomenului y, toate celelalte caracteristici care l influeneaz, fie c sunt

eseniale sau ntmpltoare, sunt considerate cu aciune constant. De exemplu, analiza legturii dintre recolta total i suprafaa cultivat.

b) Legturi multiple - se analizeaz variaia fenomenului y n funcie de mai multe


caracteristici eseniale x1, x2,..., xn. Rmne i n acest caz o component

aleatoare, care sintetizeaz aciunea, presupus constant, a celorlali factori de influen. De exemplu, analiza variaiei salariului ntr-o colectivitate n funcie de productivitate, vechime i calificare. Dup natura caracteristicii pot exista legturi stochastice de asociere sau de corelaie. a) Asocierea statistic se refer la raporturile de interdependen dintre caracteristicile calitative, sau dintre o caracteristic numeric i una calitativ. De exemplu, legtura dintre locul de munc i studii, calificare i productivitate, , ntre zona geografic i clasa de fertilitate a terenurilor agricole etc. Analiza statistic a raporturilor de asociere este posibil doar dac se gsete o modalitate de exprimare numeric a variantelor. De exemplu, clasele de calitate ale produselor pot fi codificate i ierarhizate: 0 produs inferior, 1 - produs mediu, 2 - produs superior. b) Corelaia statistic exprim raporturile de cauzalitate dintre dou sau mai multe caracteristici exprimate cantitativ. De exemplu, analiza cifrei de afaceri n funcie de numrul salariailor i valoarea capitalului fix ,analiza gradului de poluare n funcie de producia de substane chimice . Dup sensul relaiei de cauzalitate, legturile stochastice pot fi directe sau inverse. 57

a) Legturi directe exist atunci cnd modificarea ntr-un anumit sens (cretere sau scdere) a fenomenului cauz x determin modificarea n acelai sens a fenomenului efect y. De exemplu, legtura dintre numrul salariailor i volumul produciei, dintre mrimea creditului i masa dobnzii, dintre costul unitar i costul total etc. b) Legturile inverse exist atunci cnd modificarea ntr-un anumit sens a lui x determin o modificare n sens contrar a lui y. De exemplu, legtura dintre profitul unitar i costul unitar de producie, dintre impozitul pe profit i profitul net, dintre mrimea dividentelor i profitul reinvestit etc. Dup forma matematic a legturilor, acestea pot fi liniare sau neliniare. a) Liniare: legtura se realizeaz dup ecuaia dreptei. b) Neliniare: exponeniale, hiperbolice, parabolice, logaritmice.

Forma legturii este, de regul, vizibil pe grafic. Atunci cnd legtura grafic nu este clar,
se poate continua analiza pe variantele sugerate de grafic folosind metode analitice i folosind anumite criterii pentru a alege varianta cea mai bun. Dup momentul producerii lor deosebim legturi sincrone i asincrone. a) Sincrone - modificarea lui x determin modificarea imediat a lui y. De exemplu, creterea veniturilor populaiei determin mrirea imediat a cererii de consum, creterea produciei se obine concomitent cu creterea cheltuielilor etc. b) Asincrone - fenomenul x determin variaia fenomenului efect y dup o perioad de timp. De exemplu, legtura dintre investiii i creterea produciei sau legtura dintre rata dobnzii i volumul masei monetare.

1.2. Metode elementare de verificare a existenei legturilor


Studierea legturilor dintre fenomenele economice presupune parcurgerea mai multor etape: 1.depistarea factorilor care influeneaz variaia fenomenului analizat i ierarhizarea acestora; 2.alegerea factorului sau factorilor eseniali a cror influen asupra fenomenului dependent urmeaz s fie analizat; 3.culegerea i sistematizarea datelor referitoare la variabilele studiate; verificarea gradului de cuprindere a datelor nregistrate (dac datele provin dintr-un sondaj interpretarea rezultatelor se va face n sens probabilistic);

58

4.verificarea existenei i formei legturii dintre caracteristicile corelate n vederea alegerii corecte a procedeelor statistico -matematice de msurare a dependenei statistice; Verificarea existenei legturilor se poate face cu ajutorul unor metode simple: metoda seriilor paralele interdependente; metoda gruprilor; metoda tabelului de corelaie; metoda grafic; analiza dispersional. Metodele elementare evideniaz direcia legturii, iar unele dintre ele pot indica i

forma acesteia. Aplicarea acestor metode trebuie completat cu o analiz calitativ a


fenomenelor, bazat pe coninutul lor, pe legtura logic dintre ele 5.msurarea intensitii legturii cu ajutorul indicatorilor de corelaie selectai n funcie de forma de legtur i de natura informaiilor de care dispunem; 6.testarea semnificaiei indicatorilor de corelaie calculai cnd datele au provenit dintrun sondaj.

2. Corelaia statistic
Eficiena aplicrii metodei corelaiei depinde de punerea (enunarea) corect a problemei n studiu precum i de aplicarea corect a statisticii matematice. Caracterul complex al dependenei statistice pune pe primul plan problema identificrii existenei legturilor. Calculul indicatorilor de corelaie este admis cu condiia stabilirii anticipate a unei legturi cauzale reale ntre fenomenele cercetate. Statistica nu poate s rezolve o astfel de problem fr ajutorul tiinei din domeniul creia face parte fenomenul studiat. Cu alte cuvinte, specialistul din domeniul respectiv trebuie s cunoasc temeinic noiunile analizei statistice implicate pentru a da o interpretare corect a rezultatelor. Pentru a asigura deducii suficient de ntemeiate, este necesar includerea n cercetare, dac este posibil, a tuturor factorilor cu aciune esenial. La fenomenele simple, unde cauzele acioneaz separat, relaia dintre fenomenul-efect i fenomenul-cauz se reprezint sub forma:
y=f(x)

unde x reprezint cauza, iar y efectul. La fenomenele complexe, dependena se exprim sub forma general:
y = f(x1 , x2 ,..., xn)

59

Fenomenul y este generat de aciunea comun a factorilor x1 ,x2 ,.., xn (cauze), din care lum ns n calcul numai o parte. S admitem c am luat n calcul factorul x1. ntrebarea care se pune este urmtoarea: n ce condiii indicatorii corelaiei obinui exprim msura real a influenei variabilei x1 asupra variabilei y? Numai cu condiia ca factorul x1 s fie hotrtor n determinarea lui y, ceilali fiind nesemnificativi. n cazul n care fenomenul este sub aciunea unui complex de factori eseniali i aceasta este situaia obinuit, pentru a exprima influena i gradul de intensitate a legturilor n raport cu un singur factor trebuie s eliminm influena celorlai. S considerm o colectivitate statistic caracterizat prin mrimile X i Y. Efectund o serie de determinri experimentale (sau observaii) asupra acestei colectiviti, putem ntocmi tabela datelor respective: X | x1, x2 , ..., xn Y | y1 , y2 , ..., yn Repartiia empiric a celor dou variabile se poate afia grafic, ntr-un sistem de axe XOY, unde vom reprezenta punctele de coordonate xi i yi. Un ansamblu de astfel de puncte se numete cmp de corelaie, tabel de corelaie sau nor statistic. n Excel, acest lucru se poate face utiliznd diagrama XY prin puncte(XY-scatter) Analiza vizual a organizrii i formei norului de puncte obinut poate oferi indicii importante asupra relaiei dintre variabile.

Datele de sondaj vor susine ipoteza asocierii ntre variabile dac forma norului de puncte se apropie de o curb funcional.
Cele dou caracteristici sunt independente. ntr-un caz particular, dependena corelaionar se poate transforma ntr-o dependen funcional, dar cu un anumit grad de certitudine. Apare problema de stabili cantitativ (numeric) n ce msur dependena corelaional se apropie sau se deprteaz de dependena funcional. n foarte multe cazuri, din observarea fenomenelor naturale sau a proceselor sociale, fr a cunoate natura exact a acestora i nici cauzele prin care este pus n eviden o anumit caracteristic, se pot trage concluzii foarte importante prin examinarea corelaiei dintre aceste trsturi i alte evenimente. n acest mod se poate aprecia existena unei relaii statistice ntre dou sau mai multe variabile, adic, n astfel de cazuri se vorbete despre corelaii dintre mrimile care indic o dependen reciproc. Corelaia este o metod statistic de determinare a relaiei dintre dou variabile existente. Regresia este o metod statistic utilizat pentru a descrie natura relaiei dintre variabiledaca este pozitiv ,liniar sau neliniar 60

Distribuie liniar

Distribuie neliniar

Dac punctele Mi(xi ,yi) nu arat o dependen funcional strict, dar exist o tendin ca valorile lui Y s depind de cele ale lui X , dei nu n mod riguros, ntre mrimile X i Y exist o corelaie Aceasta poate s fie liniar sau neliniar

Distribuie aleatoare

Distribuie grupat

Dac punctele Mi(xi ,yi) sunt distribuite de-a lungul unei fii, care n general, urmeaz o curb determinat, spunem c ntre mrimile respective exist o dependen funcional. n cazul cnd ntre X i Y nu exist nici un fel de dependen, cmpul de distribuie se va prezenta asemntor cu acela artat n figurile de mai sus. Fiind date dou variabile X i Y, se pune problema dac ntre cele dou variabile, respectiv ntre fenomenele descrise de acestea, exist o anumit dependen numit i corelaie. O prim concluzie se poate obine reprezentnd grafic ntr-un sistem de coordonate XY, cele dou iruri de date observate pentru cele dou variabile. Dac punctele graficului se mprtie pe toat suprafaa fr a urma o anumit regul, atunci vom spune c cele dou variabile nu sunt corelate. Dac n schimb punctele descriu o anumit curb, numita i curb de regresie, atunci vom spune c exist corelaie i ea este cu att mai intens, cu ct domeniul pe care se ntind punctele este mai ngust. Mai mult, dac punctele se aeaz pe o curb care poate fi aproximat de o curb clasic (dreapt, parabol, exponenial, etc.) atunci vom spune c 61

legtura dintre cele dou variabile este una liniar sau parabolic sau exponenial, etc. i vom folosi ecuaia acelei curbe clasice pentru prognoz.

Exemplu:

Un exemplu de studiu a legturii specifice dintre : X= producia total de substane chimice din Europa nregistrat ntre anii 1996 pn n 2007 X=(xi ,i=1..12) i Y=gradul de poluare a aerului prin msurarea cantitii de gaze emise Y=(yi ,i=1..12) n Excel : x = (259, 274, 275, 248, 301, 284, 267, 270, 310, 314, 316 ,317) i y = (769.75, 732.58, 702.34, 682.04 ,648.38, 614.57, 600.43, 583.63, 565.42, 552.28, 533.93, 521.32) Datele au fost obinute de pe site-ul www.eurostat.eu .

anii productia chimica volumul emisiilor de gaze

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

259

274

275

248

301

284

267

270

310

314

316

317

769.75

732.58

702.34

682.04

648.38

614.57

600.43

583.63

565.42

552.28

533.93

521.32

Poluarea in U.E.
900 800 700 600 500 400 300 200 100 0 240 norul de puncte--> poluarea in U.E.

emisiile de gaze

260

280 productia chimica

300

320

62

Metoda celor mai mici ptrate.


Dependena funcional a unei variabile y fa de alt variabil x poate fi studiat empiric, pe cale experimental, efectundu-se o serie de msurtori asupra variabilei y pentru diferite valori ale lui x. Rezultatele se pot prezenta sub form de tabel sau grafic. Problema care se pune n acest caz este de a gsi reprezentarea analitic a dependenei funcionale cutate, adic de a alege o formul care s descrie rezultatele experimentului. Formula se alege dintr-o mulime de formule de tip determinat, de exemplu.
y = ax + b , y = ax2 + bx + c , y = aebx + c , y = a + h sin( t + )

Cu alte cuvinte, problema const n a determina parametrii a, b, c, ai formulei, n timp ce tipul formulei este cunoscut dinainte ca urmare a unor considerente teoretice sau dup forma prezentrii grafice a materialului empiric. S notm, la modul general cnd avem n parametrii, dependena funcional prin:
y = f(x; a0 ,a1 ,...,an)

Parametrii a0, a1,..., an nu se pot determina exact pe baza valorilor empirice y1,
y2,...,yn ale funciei, deoarece acestea din urm conin erori aleatoare. Este vorba de obinerea

unei estimaii "suficient de bune".

Formularea problemei
Dac toate msurtorile valorilor funciei sunt y1, y2,...,yn msurate yk de la cele calculate f(xk; a0, a1,..., an), adic expresia
S = [ yk f ( xk ; a0 , a1 ,..., an )]2
k =1 n

atunci estimaiile

parametrilor a0, a1,..., an se determin din condiia ca suma ptratelor abaterilor valorilor

s ia valoarea minim. Aflarea valorilor parametrilor a0, a1,..., an, care conduc la cea mai mic valoare a funciei
s = s (a0 , a1 ,..., an ) revine la rezolvarea sistemului de ecuaii S S S = 0, = 0 ,, =0 a0 a1 an Dac formula empiric depinde liniar de parametrii necunoscui atunci sistemul de mai sus va fi de asemenea liniar.

63

3. Dreapta de regresie.
n cazul cel mai simplu se studiaz numai dou variabile X, Y i se dorete gsirea dependenei: Y = aX + b n ipoteza c X este cauza i Y este efectul. n urma celor n probe se cunosc datele (xi ,yi), i=1,..., n i trebuie s determinm coeficienii a i b astfel nct suma S (a, b) = (axi + b yi ) 2
i =1 n

s fie minim. Se obine

a=

c xy

2 x

y c xy y = rxy x x y x

b = y ax

unde x2 este dispersia variabilei x, iar y2 este dispersia variabilei y. Mrimea

cxy = x y x y
se numete corelaia variabilelor X i Y.
cov( x, y ) = M ( x y ) M (x ) M ( y )

N se numete covarian.

M (x y ) =

x y
i =1 i

Pentru a analiza dac ntre variabilele X i Y exist o legtur liniar, se calculeaz coeficientul de corelaie liniar, dat de formulele echivalente:

rxy = cxy /x y

Funcia Excel corespunztoare este CORREL.

Sintaxa funciei :
CORREL (X,Y)= coeficientul de corelaie -parametrii de intrare reprezint doi vectori de aceeai dimensiune care conin valorile celor dou variabile pentru care dorim s calculm coeficientul de corelaie. 64

Interpretare:
Valorile coeficientului de corelaie sunt n intervalul [ 1,1] . Dac r = 0 ntre cele dou variabile nu exist corelaie. Dac r = 1, corelaia ntre cele dou variabile este maxim i direct. Dac r = -1, corelaia ntre cele dou variabile este maxim i invers. Cu ct avem o valoare mai apropiat de 1 sau -1 cu att corelaia e mai puternic (direct pentru valori pozitive i invers pentru valori negative), cu ct avem o valoare apropiat de 0 corelaia este mai slab. n ambele cazuri (r=-1, sau 1) , sintagma "tendina de a fi asociat" este un alt mod de a spune c variabilitatea lui X tinde s fie asociat cu variabilitate n Y, i vice-versa, sau, pe scurt, c X i Y au tendina de a varia mpreun.

4. Coeficient de determinare
r2 = coeficient de determinare

Dac reprezentm variaia lui X ,respectiv Y prin suprafaa a dou cercuri (suprafaa cercului reprezinta 100% din variaia fie a lui X sau Y). n caz de corelaie zero nu exist nici o tendin pentru X i Y pentru a co-varia; i, prin urmare, dup cum este ilustrat ,avem dou cercuri separate n partea de sus;

65

corelaia nu este zero,atunci cele dou cercuri se suprapun( o parte din variabilitatea lui X este explicat de variabilitatea lui Y). i anume r 2 (care reprezint procentul din variaia lui y determinat de variaia lui x )

n acest caz cele dou cercuri se suprapun (r = - 0.86 r

=0.74 ) Zona de suprapunere

reprezint 74% din variaia lui Y ( Yeste cuplat n variabilitate cuX, i invers), precum i faptul c 26% din variaia lui Y este fr nici o legtur cu variabilitatea lui X, la fel ca din variaia de X este fr nici o legtur cu variabilitate n Y.( zonele de ne-suprapunere reprezint 26% ) Aceasta zon de ne-suprapunere sau poriune de dezacord, ntre X iY se numete variaie rezidual = 1- r 2 . Dar faptul c relaiile de cauzalitate ntre variabile pot produce corelaii nu implic faptul c o relaie de cauzalitate se afl n spatele fiecrui exemplu de coresponden.

66

n final se va obine ecuaia de regresie:

Yy=

y rxy ( X x ) x

Aceast dependen reprezint o dreapt numit dreapt de regresie a variabilei Y n raport cu variabila X.

Dreapta de regresie

Observaie. Se poate vorbi i de dependena variabilei X n funcie de Y. Urmnd un calcul


asemntor se ajunge la dreapta de regresie a variabilei X n raport cu Y:

X x=

x rxy (Y y ) y

2 = 1. Se observ c cele dou drepte de regresie coincid dac i numai dac rxy

Observaii.
1. Trebuie s facem observaia c, indiferent de gradul de mprtiere al punctelor, ntotdeauna se poate gsi o dreapt de regresie, dar n cazul unei dispersii mari aceasta devine inutil. De aceea un studiu preliminar a distribuiei punctelor n plan sau spaiu se impune cu necesitate. 2. Coeficientul de corelaie este o mrime foarte important n cadrul regresiei liniare. El msoar gradul de dependen liniar ntre cauz i efect i are o valoare cuprins ntre 1 i 1. Apropierea de 1 implic o dependen liniar puternic ntre mrimi, iar apropierea de zero indic o lips a corelatiei. Valorile negative semnific o corelaie invers.

67

EXEMPLU :

Poluarea in U.E.
900 800 700 600 500 400 300 200 100 0 240 norul de puncte--> poluarea in U.E. y = -2.3086x + 1289.4 R2 = 0.4801 Linear ( norul de puncte--> poluarea in U.E.)

emisiile de gaze

260

280 productia chimica

300

320

68

MODEL DE TESTE DE VERIFICARE A CUNOTINELOR 1.Care sunt elementele definitorii ale unui studiu statistic (dai un exemplu)
2.Stabiliti tipul de variabila n urmatoarele cazuri: a. foarte bine; a) cantitativa de raport b)calitativa ordinala c)calitativa nominala b. admis; a) cantitativa de raport b)calitativa ordinala c)calitativa nominala c. 51% a) cantitativa de raport b)calitativa ordinala c)calitativa nominala a) cantitativa de raport b)calitativa ordinala c)calitativa nominala d. maghiar 3. Descriei deosebirile dintre fenomenele colective i fenomenele tipice.(dai exemple din cele dou categorii) 4.Un radar instalat intr-un pct.de control a inregistrat intr-o ora urmatoarele valori: 52, 56, 78, 25, 64, 81,44. Aflai viteza medie, median, dispersia i deviaia standard ale vitezelor nregistrate 5.La Judectoria Iai s-au ales la ntmplare 8 procese i s-au numrat amnrile la fiecare proces n parte , obinndu-se urmtoarele observaii: 2, 3, 0, 3, 4, 1, 3, 0. a) Care este tendina central a numrului de amnri pentru un proces? b) Care este probabilitatea ca alegnd la ntmplare un proces acesta s nu fie amnat ? c) Construii histograma numrului de amnri pentru un proces ,pentru a studia forma distribuiei . 6. a) Construii distribuia de frecvene pentru vrsta infractorilor din zona Iai; b) Exist o corelaie ntre vrst i infracionalitate ,tiind c V rsta Nr.infractori infractorilor Sub 18 ani 15 18-25 ani 26-35 ani 36-50 ani Peste 50 ani 25 20 30 10

7. Tendina central poate fi masurat prin: a) Median b) Amplitudine c) Media aritmetic 8. Graficele statistice trasate prin linie se utilizeaz n mod curent pentru vizualizarea: a) observaiilor oricrei serii de date statistice; b) trendului (tendinei) evoluiei n timp a unui fenomen; c) tendinei legturii dintre variabile i pentru alegerea modelelor de regresie. 9. mprtierea observaiilor fa de valoarea medie poate fi reprezentat prin: a) Amplitudine b) Mediana c) Deviaie standard 10. .O serie de timp se reprezint grafic printr-o: a) diagram de structur (de tip pie); b) diagram linie c) diagram XY prin puncte

69

Bibliografie
Virgil VOINEAGU, .Constantin MITRUT, Alexandru Isaic MANIU, Statistic, Editura ASE,Bucuresti, 2008. Emilia TITAN, Simona GHITA, Cristina TRANDAS, Statistic economic. Elisabeta JABA, Statistica ediia a treia, Editura economic 2002; Patrick BLATNER, Microsoft EXCEL 2002, Editura TEORA 2003.
www.ac.tuiasi.ro/ro/library/pdf/Introducere.pdf

http://www.ac.tuiasi.ro/ro/library/IS_Book/IS_cap11.pdf http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=116&idb

70

71

72

You might also like