VARIABILE ALEATOARE. FUNCTII DE REPARTITIE.

INDICATORI STATISTICI
VARIABILE ALEATOARE. FUNCŢII DE REPARTIŢIE. INDICATORI STATISTICI
2-1 Notiuni de teoria probabilitatilor
În teoria probabilitatilor, orice rezultat al unui experiment se numeste eveniment, sigur fiind evenimentul care se realizeaza cu certitudine la orice efectuare a experimentului. Evenimentul imposibil este cel care nu se realizeaza niciodata în cadrul unui experiment dat. Evenimentele ce apar ca rezultat al unor experimente le vom nota , , etc. Evenimentul complementar unui eveniment este acel eveniment care se realizeaza atunci si numai atunci când nu se realizeaza . Evenimentul care consta în realizarea simultana a evenimentelor , se noteaza cu (se citeste evenimentul si ).

Probabilitatea unui eveniment este o masura a sanselor de realizare a acelui eveniment. Daca un eveniment se desfasoara astfel încât producerea oricarui eveniment legat de acesta are un numar finit de sanse egal-posibile, probabilitatea evenimentului este raportul dintre numarul rezultatelor favorabile producerii evenimentului si numarul tuturor rezultatelor posibile. Se considera exemplul cunoscut al urnei care contine bile de aceeasi marime, dintre care sunt albe si sunt negre. Probabilitatea de a extrage o bila alba sau neagra va fi

, respectiv

(2.1)

.

(2.2)

Din relatia (2.1) se vede imediat ca probabilitatea unui eveniment este cu 535h79f prinsa între zero si unitate, adica . Evident, când în urna sunt numai bile negre, iar când în urna sunt numai bile

albe etc. 2-1.1 Teorema probabilitatii totale Sa presupunem ca pentru producerea unui eveniment sunt cazuri favorabile, adica din cazuri posibile, egal probabile,

. De asemenea, pentru producerea evenimentului putem scrie , pentru care avem

(2.3) cazuri favorabile,

.

(2.4) , nu se

Se mai considera ca cele doua evenimente se exclud reciproc, adica când se produce produce . Probabilitatea ca în cele cazuri posibile sa se produca sau , va fi

, relatie care reprezinta principiul probabilitatii totale, si anume:

(2.5)

Când un eveniment se poate realiza în mai multe moduri posibile care se exclud reciproc, probabilitatea producerii lui este egala cu suma probabilitatilor care corespund diferitelor moduri de producere. 2-1.2 Teorema probabilitatii compuse Se considera cazul unui eveniment mai complex care rezulta din realizarea succesiva a doua evenimente dependente si . Pentru examinarea acestei situatii mai presupunem: - în - în - în - în cazuri se produce atât evenimenul cazuri se produce evenimenul cazuri se produce evenimenul cazuri nu se produce nici nici cât si ; ; ;

dar nu se produce dar nu se produce .

Fie

numarul de cazuri total posibile. si probabilitatea este

Pentru producerea evenimentelor

si Pentru a se produce

. , probabilitatea este

(2.6)

, deoarece are , cazuri favorabile, fiind acelasi.

(2.7)

Dupa ce s-a produs evenimentul

, ramâne sa examinam probabilitatea lui

. Evident, acesta

are numai cazuri favorabile. Deoarece producerea lui este conditionata de aceea a lui (numai acele cazuri vor fi favorabile când are loc ), numarul cazurilor posibile pentru va fi . Prin urmare,

.

(2.8)

Pentru probabilitatea definita de (2.8), se foloseste notatia ceea ce înseamna probabilitatea ca sa se produca dupa ce s-a produs (probabilitate conditionata). Din compararea relatiilor (2.6), (2.7) si (2.8) rezulta principiul probabilitatii compuse si , (2.9) , si

care arata ca: Daca producerea unui eveniment presupune realizarea altor evenimente si atunci probabilitatea producerii lui este egala cu produsul dintre probabilitatea producerii lui probabilitatea lui , dupa ce s-a produs .

În conditiile de mai sus, numarul cazurilor posibile este limitat. De aceea, definitiile si probabilitatile de mai sus se refera la asa numita teorie a probabilitatilor discontinue, care se apropie de teoria probabilitatilor continue daca numarul cazurilor favorabile este destul de mare. Probabilitatea evenimentului se noteaza si este un numar cuprins între 0 si 1, valoarea 0 corespunzând unui eveniment imposibil, iar 1 unui eveniment sigur. Daca masurarea unei marimi se efectueaza, în conditii identice, de un numar mare de ori ,

Astfel.12) Se numeste repartitie a unei variabile aleatoare legea de probabilitate dupa care ea se produce. valori se afla în intervalul . 2-2. Numarul valorilor posibile ale unei variabile aleatoare discrete poate fi finit sau infinit. Variabilele aleatoare se clasifica dupa multimea pe care sunt definite. Functia de repartitie (sau functia cumulativa a probabilitatilor) a unei variabile aleatoare discrete este suma probabilitatilor de la stânga punctului de abscisa (Fig.11) Din punct de vedere probabilistic.1) . Variabila aleatoare continua este definita pe o multime continua. 2. se deosebesc variabile aleatoare de tip discret si de tip continuu. functia de repartitie caracterizeaza complet o variabila aleatoare.1 Functia de repartitie Functia de repartitie a variabilei aleatoare probabilitatea evenimentului . Variabila aleatoare continua poate lua orice valoare între doua numere. (2. indiferent daca este vorba de o variabila aleatoare discreta sau continua. în raport cu rezultatul unui experiment.10) este o caracteristica a intervalului considerat. Variabilele aleatoare discrete sunt definite pe o multime cel mult numarabila de evenimente. Repartitia unei variabile aleatoare discrete se scrie sub forma . (2. Numarul valorilor posibile ale unei variabile aleatoare continua este infinit. poate lua orice valoare dintr-o multime bine definita de valori reale (domeniul de definitie al variabilei). se noteaza cu si este definita ca (2. si se numeste frecventa relativa a variabilei în intervalul 2-2 Variabile aleatoare Se numeste variabila aleatoare o marime reala care. iar din acestea.obtinându-se siruri de valori aleatorii probabilitatea .

. (2. Repartitia unei variabile continue Functia de repartitie are urmatoarele proprietati: 1. (2. functia de repartitie se defineste astfel (Fig.15) .2): .13) Fig. 2.2.14) Fig. Functia de repartitie este o functie monoton nedescrescatoare .1. Pentru cea mai mica valoare posibila a variabilei aleatoare . daca . Repartitia unei variabile discrete Daca este o variabila aleatoare continua. (2. 2. 2.sau . functia de repartitie este 2.

18) (2. 4.17) 5. 2. adica cu cresterea functiei în intervalul considerat . în scara. (2.egala cu zero . 2. .2 Densitatea de repartitie Se numeste densitate de repartitie (sau densitate de probabilitate) prima derivata – daca exista – si ).3. Functia de repartitie Functia de repartitie a unei variabile aleatoare continue este. . admite salturi. functia de repartitie este (2. Pentru cea mai mare valoare posibila a variabiei aleatoare egala cu 1 . în care functia are drept asimptote dreptele 2-2.3.3. 3.19) Functia de repartitie a unei variabile discrete este o functie discontinua. Functia de repartitie fiind o probabilitate. salturile de la o treapta la treapta curenta sunt egale cu (Fig.a). suma tuturor salturilor fiind egala cu 1 a) b) Fig. satisface dubla inegalitate .b. 2. de asemenea o functie continua (Fig. Probabilitatea ca variabila aleatoare sa fie cuprinsa între si este egala cu diferenta dintre valorile functiei de repartitie la extremitatile intervalului.16) . (2.

în care . adica evenimentul este imposibil.24) si adica este probabilitatea realizarii simultane a evenimentelor si Produsul a doua variabile aleatoare si este o variabila aleatoare având repartitia . (2. . Daca si . (2.22) este o constanta reala. si (2. iar este sigur. (2.21) 2-2.(2.a functiei de repartitie . .23) este o variabila aleatoare având repartitia Suma a doua variabile aleatoare . .20) Densitatea de repartitie exista numai pentru variabile de tip continuu. Probabilitatea ca variabila aleatoare continua integrala densitatii de repartitie pe intervalul sa ia valoare în intervalul este egala cu . atunci este o variabila aleatoare având repartitia .3 Operatii cu variabile aleatoare Fie si doua variabile aleatoare având repartitiile .

Daca repartitia unei variabile nu este cunoscuta. (2. Densitatea de repartitie este nenegativa si aceasta rezulta din proprietatea functiei de repartitie de a fi nedescrescatoare. este egala cu unitatea.27) 2-3 Valorile tipice ale variabilei aleatoare O variabila aleatoare este caracterizata prin repartitia sa. Media Prin definitie. în care . (2. (2. . pentru caracterizarea variabilei aleatoare se pot folosi anumite marimi numite valori tipice.25) si Densitatea de repartitie are proprietatile: . valoarea medie (speranta matematica) a unei variabile aleatoare discrete cu repartitia (2. (2.29) .28) densitatea sa de repartitie. Integrala densitatii de repartitie. Fie o variabila aleatoare de tip continuu si variabile aleatoare continue este definita de relatia (2. .13) este egala cu suma produselor dintre valorile pe care le poate lua si probabilitatile corespunzatoare .. în cadrul limitelor de variatie infinite. Media unei .26) 1. 2. asociate variabilei aleatoare. a variabilei aleatoare continue.

Pentru o variabila aleatoare continua.32) ca mediana este solutia ecuatiei (2.36) adica.32) . diferenta dintre media patratului variabilei aleatoare si patratul mediei variabilei aleatoare. Dispersia Dispersia unei variabile aleatoare discrete (2.35) .Daca variabila aleatoare este definita pe intervalul . sau (2.31) (2. mediana este data de ecuatia (2. sau . Mediana Se numeste mediana a variabilei aleatoare .34) reprezinta valoarea medie a patratului abaterii . atunci valoarea medie este .33) . Rezulta din ecuatia (2.30) . (2. numarul care satisface ecuatia (2. Dispersia unei variabile aleatoare continue este media patratului abaterii lui .

39) . . calculat în raport cu media (2. Folosind momentele simple.43) . (2. (2.37) este radacina patrata a dispersiei acestei (2. este . (2. care este zero.38) Dispersia si abaterea medie patratica sunt indicatorii cei mai utilizati pentru a caracteriza împrastierea valorilor unei variabile aleatoare. calculat în raport (2. Abaterea medie patratica Abaterea medie patratica a unei variabile aleatoare variabile aleatoare ..41) Momentul centrat de ordinul k al unei variabile aleatoare discrete aritmetica a variabilei aleatoare. dispersia se poate exprima dupa cum urmeaza: (2. Momentul simplu (initial) de ordinul 1 reprezinta media aritmetica . datorita proprietatii mediei aritmetice conform careia . are expresia .40) . Momente Momentul simplu (initial) de ordinul k al unei variabile aleatoare discrete cu originea abaterilor.42) Momentul centrat de ordinul 1 este zero. în care reprezinta momentul simplu de ordinul 2.

45) (2. În particular.51) .50) (2. Momentul centrat de ordinul al unei variabile aleatoare continue (2.Momentul centrat de ordinul 2 în raport cu media aritmetica este dispersia . este media variabilei . calculat în raport cu o valoare arbitrara aleatoare . Momentul initial de ordinul al unei variabile aleatoare continue este (2.48) .47) este . pentru rezulta dispersia variabilei aleatoare continue (2. Între momentele initiale si momentele centrate exista urmatoarele relatii: .44) .46) se obtine valoarea medie a variabilei aleatoare continue . pentru (2. Momentul ordinar de ordinul k. (2. În particular. Momentul ordinar (conventional) de ordinul este (2.49) .

53) reprezinta momentul centrat mixt al celor doua . atunci si (2.52) (2. atunci (2.. . 2-3. Se numeste coeficient de covarianta raportul (2.54) se obtine formula echivalenta de calcul . în care sunt numite corelatii. atunci valoarea medie a variabilei .54) (2. Daca variabilele exista. Coeficientul de covarianta Covarianta a doua variabile aleatoare variabile si (2. Dezvoltând (2.57) doua constante.1 Proprietatile valorilor tipice ale variabilei aleatoare Proprietatile mediei Media unei variabile aleatoare are proprietatile: 1. iar sunt independente atunci . Daca . Inegalitatea este o consecinta a inegalitatii lui Schwarz [ ]. reciproca nefiind adevarata. Daca este o constanta .55) .56) sunt elementele matricei de covarianta. 2. Daca aleatoare este o variabila aleatoare si este egala cu si .

62) si o constanta reala. sunt doua variabile aleatoare independente având dispersiile . atunci oricare ar fi numerele reale si .59) 4. 3. Pentru orice variabila aleatoare are loc inegalitatea Cebîsev [ ] . Daca si cu dispersia este (2. atunci valoarea medie a variabilei aleatoare . . 2. dispersia variabilei . exista si este egala cu (2. Proprietatile dispersiei Dispersia unei variabile aleatoare are proprietatile: 1. si (2. atunci valoarea medie a variabilei aleatoare . Daca este o variabila aleatoare având dispersia . Fie o variabila aleatoare dispersia variabilei aleatoare .61) . . atunci (2. atunci variabila 5. atunci pentru oricare doua constante 3. Daca si respectiv si sunt doua variabile aleatoare independente pentru care exista valorile medii .60) exista. egalitatea având loc doar pentru 4. Daca respectiv. exista si este egala cu (2. Daca aleatoare este o variabila aleatoare a carei valoare medie se numeste abatere de la valoarea medie. .63) .58) si sunt doua variabile aleatoare independente având valorile medii .. respectiv este (2.

Functia hazard sau rata cedarii a unei variabile repartitie si functia de supravietuire: (2. iar - este distribuita discret atunci functia caracteristica este data de relatia .64) 2-4 Functii derivate Se numeste functie caracteristica a variabilei aleatoare aleatoare. arbitrar. obtinute din un parametru real. (2. Daca variabila . (2. Daca repartitia variabilei relatia (2. (2. înlocuind argumentul prin . unde este unitatea imaginara. (2.69) .66) este data de este de tip continuu.65) atunci functia caracteristica este are distributie continua cu desinatea . valoarea medie a unei noi variabile . densitatea sa de repartitie ..70) . Daca variabila .67) sa Functia de supravietuire sau de fiabilitate reprezinta probabilitatea ca o variabila aleatoare ia o valoare mai mare decât . (2.68) este definita ca raportul dintre densitatea de .

Functia generatoare a unei variabile aleatoare definita de relatia (2. Dintre indicatorii derivati amintim: marimile relative si marimile medii. indicatorii pot fi împartiti în doua categorii: (a) indicatori absoluti (primari). evolutive ale colectivitatii cercetate.sau . amplitudinea fenomenului în unitati concrete. obisnuite si centrate de diferite ordine. În functie de metoda obtinerii indicatorilor si de rolul jucat în cercetarea statistica. media geometrica. de estimare. Orice indicator statistic trebuie sa îndeplineasca doua conditii: (a) sa aiba un continut stiintific bine determinat. de comparare. .71) care ia numai valori întregi pozitive este . . aspecte calitative. Functiile indicatorilor statistici sunt: de masurare. mediana. (b) indicatori derivati (secundari).1 Indicatorii tendintei centrale Principali indicatori ai tendintei centrale sunt: (a) indicatorii medii de control: media aritmetica. 2-5. de verificare a ipotezelor statistice. în consecinta acestia reflecta dimensiunea. cuartilele si decilele. . o definitie sau o formula a sa. (b) sa indeplineasca conditia de compatibilitate. indicatorii variatiei si ai asimetriei. marimea. 2-5 Indicatori statistici Indicatorul statistic reprezinta expresia numerica a unei trasaturi observate pe o colectivitate definita în timp si spatiu. media armonica etc. specifice. de testare a semnificatiilor parametrilor statistici utilizati.73) Functia caracteristica se utilizeaza pentru calculul mometelor factoriale. de masura. parametrii functiilor de regresie si ajustare analitica etc. indicii statistici.72) Între funtia caracteristica si functia generatoare exista relatia . (b) indicatorii medii de pozitie: modul. de sinteza. (2. (2. Indicatorii absoluti sunt rezultatul observarii si sistematizarii datelor. Indicatorii derivati se obtin în procesul de calcul statistic si reflecta într-o maniera abstracta.

. Functie de natura datelor înregistrate si de natura variatiei. media poate fi: media aritmetica (simpla). Media aritmetica ponderata este influentata atât de nivelul caracteristicii cât si de nivelul frecventei. suma abaterilor nivelurilor individuale ale variabilei aleatoare fata de media lor diind egala cu zero.75) în care reprezinta frecventa sau numarul de aparitii al variabilei . media armonica. media patratica.Media armonica simpla .… (2. Se disting doua cazuri: . .… se . Media aritmetica ponderata a unui sir de valori . tipic si obiectiv în aparitia.74) se calculeaza cu relatia . Media armonica este o valoare interna seriei din care a fost calculata. Media armonica Media armonica reprezinta acea valoare care înlocuid termenii reali din colectivitate nu modifica suma inverselor. (2. Principiul pe care se bazeaza media este cel al compensatiei abaterilor (+ sau -). manifestarea si dezvoltarea unei variabile (caracteristici) [1]. media cronologica etc.Media aritmetica Media este expresia sintetizarii într-un singur nivel reprezentativ a tot ce este esential. . media cubica. media parabolica. Media aritmetica este o valoare interna a seriei din care a fost calculata (trebuie sa fie mai mare decât valoarea minima si mai mica decât valoarea maxima). (2.76) . media geometrica. Media aritmetica simpla de sondaj (sau de selectie) a unui sir de valori calculeaza cu relatia .

79) Media geometrica Media geometrica este acea valoare care înlocuid termenii reali din colectivitate nu modifica produsul acestora.Media geometrica ponderata . modificându-se aproximativ dupa o functie exponentiala.Media patratica simpla . Media geometrica se utilizeaza pentru calculul indicelui mediu de crestere sau descrestere. nici de valorile cele mai mari. Media patratica Se foloseste când nivelul variabilei prezinta cresteri din ce în ce mai mari. (2.78) se foloseste media armonica special ponderata. În acest caz.80) . Ponderarea nu se face cu ci cu . media armonica este un artificiu de calcul pentru a determina media aritmetica când datele nu permit aflarea directa a acesteia (2. dar nu poate fi determinata daca unele valori sunt nule sau negative. Se disting doua cazuri: .81) Media geometrica nu este influentata nici de valorile cele mai mici. (2. Când nu se cunosc frecventele (2.Media geometrica simpla (neponderata) sau .Media armonica ponderata . În cazul mediei geometrice functia determinanta este de tip multiplicativ si se disting doua cazuri: .

82) . Media geometrica este sensibila la variatii mari care prin ridicare la patrat devin foarte mari.Media patratica ponderata (2. În acest caz. Daca intervalele de timp care separa termenii seriei cronologice sunt egale.83) Media patratica se poate calcula si pentru variabile nule sau negative. Media progresiva se calculeaza cu relatia . Media cronologica Media cronologica este utilizata pentru determinarea nivelului mediu al seriilor cronologice de momente. (2. Într-o serie statistica în care se pot calcula toate mediile exista relatia . se calculeaza media cronologica simpla (2.84) . . mediile partiale din care se calculeaza media întregii perioade sunt ponderate cu durata perioadelor partiale cuprinse între termenii seriei dupa formula .85) Daca intervalele de timp dintre termenii seriei cronologice de momente sunt neegale atunci se calculeaza media cronologica ponderata.. (2. Media progresiva (2. Media cronologica este o medie care are la baza principiul de calcul al mediei aritmetice.86) Media progresiva reprezinta o medie a timpilor de nivel calitativ superiori în cadrul colectivitati date.

marimea intervalului. - .91) . mediana este reprezentata de valoarea de rang . mediana corespunde valorii abscisei pentru care ordonata împarte suprafata delimitata de curba de repartitie în doua parti egale. În general.frecventele caracteristicii . s-a convenit sa se considere ca mediana media aritmetica a celor doua valori mediane: (2. (2. unde în care: este limita inferioara a intervalului median. Din punct de vedere analitic. În cazul seriilor de distributie. în care Mediana este media generala a seriei.89) . deci mediana împarte sirul de date în doua parti egale.media termenilor calitativ superiori mediei generale.87) . . mediana se determina cu formulele: (2.88) Mediana unei functii de repartitie mica a lui au probabilitati egale este valoarea pentru care valoarea mai mare si mai . iar (2. este numar impar.marimea intervalului. Mediana este acea valoarea a caracteristicii fata de care frecventa valorilor mai mica decât ea este egala cu frecventa valorilor mai mari decât ea.. Daca sirul de date este constituit dintr-un numar impar de valori . În cazul în care sirul de date este constituit dintr-un numar par de valori . (2. unde este numar par.frecventa intervalului median. . mediana se situeaza între doua valori mediane si .90) .

Minimul densitatii de repartitie este antimod. . centile. . modul se calculeaza cu relatia pentru care functia are un maxim. .marimea intervalului modal.diferenta dintre frecventa intervalului modal si frecventa intervalului premodal (anterior). Modul mai poate fi definit ca valoarea caracteristicii careia îi corespunde densitatea maxima de repartitie. prin definitie. . Cuartile . plurimodala. repartitia se numeste bimodala. cuartile. . Modul unei functii de repartitie este valoarea lui Intervalul modal este intervalul cu frecventa cea mai mare. mediana si modulul caracterizeaza tendinta centrala si forma de variatie a caracteristicii. cuantilele se numesc: mediana.92) . În cazul unei distributii simetrice ele coincid. Ele descriu pozitia anumitor termeni în cadrul seriilor statistice.93) Media. . valoarea caracteristicii cu frecventa cea mai mare de aparitie în colectivitate. decile. în care Cuantilele este valoarea cea mai mare dintre valorile . iar (2. Daca sirul de masuratori are doua valori maxime. Valoarea centrala a sirului Valoarea centrala a sirului de date este . (2. Functie de valorile lui . În cazul seriilor de distributie.diferenta dintre frecventa intervalului modal si frecventa intervalului postmodal (urmator). (2. unde: este limita inferioara a intervalului modal. K. Cuantilele sunt valori ale caracteristicii care împart seria în parti egale. Person [ ] a stabilit o expresie care da valoarea modului în functie de media aritmetica si mediana pentru toate repartitiile unimodale . .Modul Modul este.94) . iar daca sunt mai multe. cea mai mica.

marimea intervalului în care se afla cuartila Cuartila centrala a seriei se noteaza cu . . este dat de relatia Locul unei cuartile oarecare .frecventa intervalului . - frecventa intervalului . ea reprezentând valoarea unitatii mediane. Cuartilele.marimea intervalului în care se afla decila pâna la intervalul . Cuartila inferioara iar cuartila superioara este unitatea mediana a valorilor situate în partea inferioara a medianei .96) . Centilele (2. . Ordonata corespunzatoare acestei unitati împarte aria delimitata de curba distributiei în doua parti egale. este mediana valorilor situate în partea superioara a medianei propriu-zise. (2. în numar de trei. Locul unei decile oarecare este dat de relatia este limita inferioara a decilei . .96) Decilele. împart seria în zece intervale de frecvente egale cu 1/10 . . în numar de noua. unde . unde este limita inferioara a cuartilei .Cuartilele sunt marimi de pozitie în seriile statistice. (2.95) . împart seria în patru parti de frecvente egale cu 1/4 . Decilele (2.frecventa cumulata pâna la intervalul .frecventa cumulata (suma frecventelor anterioare) .96) .

împart seria în 100 de intervale egale . - . în numar de 99. considerându-se relatia . Pentru o serie de frecvente variate.2 Indicatorii de masura a împrastierii Dispersia Dispersia (sau varianta) sirului de date.frecventa cumulata pâna la intervalul . Abaterea medie patratica (2.101) . abaterea standard) se calculeaza cu formula .100) Pentru o serie simpla.97) . dispersia se calculeaza cu formula . denumita si dispersie de sondaj (esantion) este indicatorul de baza al împrastierii. (2.marimea intervalului în care se afla centila 2-5.98) . Pentru o serie simpla. dispersia se calculeaza cu formula (2. unde este limita inferioara a centilei .Centilele.99) Dispersia de sondaj se poate folosi ca estimatie a dispersiei din populatia originara (dispersie de selectie). frecventa intervalului . (2. (2. . abaterea medie patratica (sau deviatia standard de sondaj.

Pentru o serie de frecvente variate (2. . (2. Abaterea medie liniara (2. Coeficientul de variatie Coeficientul de variatie al sirului de date se calculeaza ca raportul dintre abaterea medie patratica si media aritmetica a sirului de date . abaterea medie patratica se calculeaza cu formula . Coeficientul de variatie ia valori începând cu 0. Daca depaseste 35% se considera ca intensitatea variatiei creste si colectivitatea este eterogena iar media tinde sa fie o marime nereprezentativa.104) .Pentru o serie de frecvente variate.102) . Daca (2.105) Abaterea medie liniara se foloseste pentru a caracteriza omogenitatea colectivitatii statistice.106) este pâna în 35% se considera ca intensitatea variatiei este redusa.103) Abaterea medie liniara (sau abaterea medie absoluta) se calculeaza ca media aritmetica din valorile absolute ale abaterilor variantelor caracteristicii fata de media acestor variante. colectivitatea este omogena si media este reprezentativa. Abaterea medie patratica a populatiei originara este (2. Pentru o serie simpla .

Coeficientul de variatie intercuartilica Coeficientul de variatie intercuartilica este rapotrul dintre semiintercuartila si mediana .Abaterea medie intercuartilica Abaterea medie intercuartilica este definita ca jumatatea intercuartilei . Abaterea medie intercuartilica este folosita în analiza dispersionala si are avantajul ca poate fi usor calculata.109) Amplitudinea se poate calcula si ca marime relativa. Amplitudinea Amplitudinea variatiei exprima marimea câmpului de împrastiere în jurul mediei. (2.110) Amplitudinea variatiei are aplicatie în studiul statistic al calitatii productiei. Amplitudinea relativa este raportul dintre amplitudinea absoluta si media aritmetica a sirului de date . (2. abaterea medie intercuartilica nu se poate utilize pentru comparatii între serii statistice diferite din punct de vedere al unitatilor de masura.108) Coeficientul de variatie intercuartilica prezinta avantajul unei comparabilitati mai largi. (2. Având în vedere ca se exprima în aceeasi unitate de masura ca si variabila analizata. Momente Momentele sunt acele valori care caracterizeaza o repartitie si permit precizarea anumitor .107) Intercuartila este o masura a dispersiei exprimata prin diferenta dintre cuartila superioara si cea inferioara. Abaterea medie intercuartilica reprezinta aproximativ din abaterea standard si este mai putin exacta decât abaterea medie liniara. Amplitudinea absoluta este diferenta dintre valoarea cea mai mare si valoarea cea mai mica a sirul de date . (2.

caracteristici ale repartitiei.115) . Exista mai multe tipuri de momente: Pentru serii simple. momentul ordinar are expresia (2. . are expresia (2.113) . momentul ordinar de ordinul are expresia (2. (2. Momentul centrat de ordinul . pentru serii simple.111) . Pentru serii simple.114) . Pentru serii de distributie.116) . Pentru serii de distributie. calculat în raport cu o valoare arbitrara . Pentru serii de distributie. momentul simplu de ordinul are expresia . momentul centrat are expresia (2. momentul simplu se calculeaza cu relatia (2.112) .

iar (2. (2. de îndepartare a acestor distributii de la simetrie. De asemenea. 2. Daca: atunci exista simetrie perfecta.118) este momentul centrat de ordinul doi.2-5. sau în functie de momentele centrate (2. Distributii asimetrice: . Pentru cuantificarea gradului de asimetrie se foloseste coeficientul de asimetrie definit de relatia .3 Indicatorii asimetriei Coeficientul de asimetrie Pentru caracterizarea seriilor de distributie unidimensionale si unimodale este necesara cunoasterea gradului de oblicitate. în care este momentul centrat de ordinul trei.119) exista asimetrie pozitiva sau de stânga. coeficientul de asimetrie poate fi definit ca diferenta dintre medie si mod .117) . exista asimetrie negativa sau de dreapta. a) b) Fig. aspect denumit asimetrie.4.

media aritmetica.a) asimetrie negativa.abaterea medie patratica. repartitia este simetrica.121) Coeficientul de asimetrie mai simetric. Pentru masurarea asimetriei se foloseste cel mai des coeficientul de asimetrie Pearson [ ] definit de relatia (2. cu cât se apropie de zero cu atât sirul este Coeficientul de asimetrie determinat pe baza cuartilelor are expresia . Pentru repartitii moderat asimetrice . b) asimetrie pozitiva. Coeficientul de boltire (2. Daca repartitia prezinta o asimetrie pozitiva. repartitia prezinta o asimetrie negativa.122) . are valori între –3 si +3.120) în care Daca Daca este modulul. .123) Coeficientul de boltire se calculeaza ca raport între momentul centrat de ordinul patru si patratul momentului centrat de ordinul doi . . (2. Coeficientul de asimetrie determinat pe baza centilelor are expresia (2. Coeficientul de asimetrie determinat pe baza metodei Fisher [ ] are expresia . în care reprezinta mediana.

în vecinatatea modului de sondaj. curba densitatii de repartitie se numeste leptocurtica si este mai ascutita la vârf repartitia se numeste platicurtica si are vârful mai plat decât o repartitia se numeste normala sau mezocurtica. curtozisul este dat de relatia . (2. AVERAGE . b.. Pentru determinarea curtozisului se foloseste coeficientul de boltire.124) . MEDIAN . Daca (2. (2.128) Se pot utiliza urmatoarele functii Excel: a. decât curba normala.127) .Media aritmetica. Daca curba normala.Mediana . în care: (2. Daca Curtozisul se poate determina si cu ajutorul cuartilelor si al centilelor cu relatia .126) Coeficientul de boltire este un indicator al pantei curbei densitatii de repartitie.125) . Curtozisul Curtozisul arata gradul de concentrare al frecventelor în zona centrala a distributiilor unimodale. (2. stiind ca pentru repartitia normala si considerând aceasta valoare ca nivel standard în masurarea gradului de boltire al distributiei unimodale.

Se poate calcula si cu functia KURT. In cazul modulului o situatie care apare este cea in care seria nu are modul. O alta situatie posibila este ca seria sa fie bimodala sau trimodala. j. Standard Deviation – Deviatia standard sau Abaterea standard se poate calcula si cu STDEV sau pentru deviatia standard populationala STDEVP. Se poate calcula si cu functia AVERAGE.Abaterea standard de selectie STDEV/AVERAGE . q. r. Standard Error – Eroarea standard. o.Variatia de selectie STDEVP . l. Atunci va fi afisata numai prima valoare in ordinea aparitiei lor in cadrul seriei. Se poate calcula si cu functia MODE. i.3. h.Modulul VARP . g. Mode – Modulul este valoarea care are cea mai mare frecventa din serie.4 AVEDEV – media deviatiei de la media aritmetica DEVSQ – suma de patrate a deviatiilor valorilor de la media aritmetica GEOMEAN. f. Se poate calcula si cu functia STDEV. Median – Mediana este o valoare a seriei astfel incat jumatate dintre observatii au valori mai mici (sau egale) si cealalta jumatate au valori mai mari (sau egale). k.Cvartila 1. m. adica toate valorile apar o singura data. • • • . In cazul nostru valoarea -0.99 a boltirii indica o curba putin mai aplatizata decat curba normala.Variatia populatiei (se calculeaza numai daca avem in studiu o populatie) VAR . MODE . e. In acest caz pentru determinarea tuturor valorilor modulului se poate face un tabel de frecventa. n. Excesul α 4 este zero pentru o serie de date avand o distributie normala.Abaterea standard a populatiei (se calculeaza numai daca avem in studiu o populatie) STDEV . Sample Variance – Variatia se poate calcula si cu VAR sau pentru variatia populationala VARP Kurtosis – Excesul sau Boltirea masoara inaltimea aplatizarii sau boltirii unei distributii in comparatie cu o distributie normala.media geometrica HARMEAN – media armonica KURT. Se poate calcula si cu functia MEDIAN. este pozitiv pentru o serie de date avand trena mai inalta decat cea a unei distributii normale (cu media si variatia S2) si este negativ pentru o serie de date a carei trena este mai coborata decat cea a unei distributii normale.2.Coeficientul de variatie QUARTILE.boltirea sau kurtosis-ul MAX – maximul MIN – minimul PERCENTILE – returneaza a k-a percentila SKEW – asimetria Interpretarea rezultatelor • • • • Mean – Media aritmetica.c. p. d. Atunci va fi afisata valoarea #N/A.

Minimum – Minimul valoarea cea mai mica din serie. A treia cvartila este o valoare avand proprietatea ca 75% dintre datele seriei sunt mai mici sau egale cu ea iar 25% mai mari sau egale cu a treia cvartila. daca CV este peste 30% atunci populatia poate fi considerata eterogena. este pozitiva pentru o serie de date asimetrica spre dreapta (seria are mai multe valori mai mari). iar 75% mai mari sau egale cu prima cvartila. iar celelalte sunt mai mari. CV=STDEVP/AVERAGE . deci este putin deplasata la dreapta fata de curba normala. Quartilele si percentilele sunt asemanatoare medianei.Coeficientul de variatie : se pot utiliza urmatoarele reguli empirice pentru interpretare: daca CV este sub 10% atunci populatia poate fi considerata omogena. Range – Intervalul este diferenta Maximul-Minimul seriei de date.02.• • • • • • • • Skewness – Asimetria masoara abaterea de la aspectul simetric si directia asimetriei (pozitiva sau negativa) fata de curba normala. Maximum – Maximul valoarea cea mai mare din serie. daca CV este intre 10%-20% atunci populatia poate fi considerata relativ omogena. daca CV este intre 20%-30% atunci populatia poate fi considerata relativ eterogena. Asimetria este 0 pentru o serie de date avand o distributie normala. Count – Numarul de observatii n=20. Se poate calcula si cu functia SKEW. Se poate calcula si cu functia MAX Sum – Suma sau Totalul valorilor seriei. A doua cvartila este reprezentata de mediana. Percentila de ordinul a este o valoar cu proprietatea ca o proportie egala cu a din date sunt mai mici sau egale. . Se poate calcula si cu functia COUNT. In cazul nostru asimetria este 0. este negativa pentru o serie de date asimetrica spre stanga (seria are mai multe valori mai mici). Se poate calcula si cu functia SUM. Se poate calcula si cu functia MIN. Astfel. prima cvartila sau este o valoare avand proprietatea ca 25% dintre datele seriei sunt mai mici sau egale cu ea.

Sign up to vote on this title
UsefulNot useful