You are on page 1of 10

Obiectul statisticii matematice

Statistica matematic ramur modern a matematicilor aplicate are drept obiect gruparea, analiza i interpretarea datelor referitoare la anumite fenomene, precom i prognoza evoluiei acestor fenomene. Conceptul fundamental cu are opereaz statistica matematic este probabilitatea. Este cunoscut faptul c teoria probabilitilor se ocup cu studiul variabilelor aleatoare i al proceselor aleatoare (deci al familiilor de variabile aleatoare) cutnd s determine modul de repartizare a frecvenelor valorilor acestora. Statistica matematic abordeaz problema invers i anume pornind de la modul de repartizare a frecvenelor valorilor unei caracteristici definitorii pentru un fenomen i propune s stabileasc legea de probabilitate creia i se supune fenomenul respectiv. Culegerea i nregistrarea datelor ce caracterizeaz un fenomen analiza i interpretarea lor fcnd apel la metodele statisticii metematice constituie aa!numita analiz statistic a fenomenului. Elementul cu care opereaz statistica matematic este mulimea format din uniti (obiecte sau indivizi) care se difereniaz prin diferite caracteristici (atribute) purtnd numele de colectivitate (statistic) sau populaie (statistic). "roblema fundamental pe care i propune s o rezolve statistica matematic este urmtoarea# fr a cunoate apriori repartiia unei populaii s se determine pe baza e$perienelor ce se fac asupra populaiei repartiia acesteia eventual caracteristica pincipal a acesteia. Cea mai important metod de cercetare a statisticii matematice n scopul realizrii obiectivului propus este metoda seleciei sau altfel spus metoda eantioanelor. 1. etoda seleciei. etoda eantioanelor.

%etoda seleciei const n urmtoarele# dat fiind o populaie format din & uniti se fac n e$periene independente i se obin rezultatele x( x ' ... x n ) pe baza acestor rezultate se pune problema determinrii caracteristicii * a populaiei (medie dispersie etc.) "rin urmare se e$trage din populaia statistic o popupaie parial denumit selecie (eantion sau sonda+) din studiul creia se urmrete s se obin date (informaii) privind populaia total. ,ezult de aici faptul c statistica matematic are drept obiect studiul inferenelor, adic studiul metodelor (procedeelor) de a obine date privind populaia total pornind de la informaii incomplete. -ubliniem faptul c datele obinute din selecie sunt variabile deoarece se sc.imb de la o selecie la alta. ,epartiia populaiei (cercetate) se numete repartiie teoretic) evident aceasta repartiie este necunoscut apriori. /alorile tipice ale repartiiei teoretice vor fi numite n mod corespunztor i anume medie teoretic median teoretic etc. /ariabilele x( x ' ... x n ce constituie rezultatul celor n e$periene independente efectuate asupra populaiei se numesc variabile de selecie.

0 funcie f ( x( x ' ... x n ) dependent de variabilele de selecie se numete funcie de selecie sau statistic) dintre funciile de selecie menionm# (i). %edia de selecie x = ( x( + x ' + ... + x n ) )
r r r (ii).%omentul de selecie de ordinul r) M r = ( x( + x ' + ... + x n ) .

( n

( n

"entru ca din prelucrarea seleciei s se poat concluziona asupra caracteristicilor populaiei trebuie ca selecia s fie reprezentativ adic structura ei s fie apro$imativ aceeai cu structura populaiei totale. 0 selecie reprezentativ presupune c fiecare unitate din selecie este aleas aleator din populaia statistic fiecare unitate din populaie avnd aceeai probabilitate de a fi selectat. !. "ipuri de selecie 0peraia de construire a eantionului se numete selecie sau sonda#. $aracteristica * a populaiei statistice ce se cerceteaz poate fi alternativ sau # caracteristicile alternative sunt acele caracteristici care au numai dou variante (valori) posibile i anume e$primate prin e$istena sau ine$istena lor spre deosebire de caracteristicile nealternative care au mulimi finite sau infinite de valori. -elecia efectuat din populaia poate fi# ! simpl ! stratificat. Selecia simpl. 1ac populaia este suficient de omogen se face o selecie simpl e$trgnd aleator n uniti. 1up modul de e$tragere a unitilor selecia simpl poate fi# ! repetat dac de fiecare dat ce unitatea e$tras a fost cercetat se ntoarde napoi n populaia caz n care se pot realiza
Nn selecii n2

astfel ca dou eantioane (selecii) s difere cel puin prin natura unei uniti de sonda+) se presupune c volumul populaiei este & (finit). ! nerepetat dac unitatea cercetat dup e$tragere nu se mai ntoarce n napoi n colectivitatea din care a provenit caz n care se pot realiza C N selecii. 1ac x( x ' ... x n sunt valorile de sonda+ obinute n urma cercetrii unitilor eantionului dup caracteristica * se pot calcula media i dispersia de selecie# ( n ( n x = xi ) s ' = ( xi x) ' n i =( n i =( pentru o caracteristic nealternativ respectiv n f = ( ) f (( f ) n pentru o caracteristic alternativ unde n( este numrul unitilor care posed caracteristica respectiv din cele n uniti observate.

/aloarea cercetrii realizate prin metoda seleciei depinde n mare msur de volumul seleciei deoarece cu ct acesta crete cu att scade abaterea medie ptratic a mediei de selecie. "entru determinarea volumului n al seleciei trebuie s se in seama de precizia pe care trebuie s o aib rezultatele de probabilitatea cu care se garanteaz obinerea acestora de operativitatea ce se cere n realizarea lucrrii de natura unitilor statistice. 0 variant particular a seleciei simple este selecia de serii caz n care cele & uniti simple ale populaiei sunt aran+ate n , uniti comple$e ale unei 3 populaii . 4iecare unitate comple$ este compus dintr!o serie se acelai numr de uniti simple. "entru fiecare serie e$tras se calculeaz nivelul mediu al caracteristicii obinndu!se astfel irul de valori medii x ( x ' ... x r pentru o caracteristic nealternativ i f ( f ' ... f r pentru o caracteristic alternativ. Cu a+utorul acestor valori se pot calcula media i dispersia seleciei de serie. ( r ( r ' x = xi ) sx = ( x i x) ' r i =( r i =( pentru o caracteristic nealternativ i ( r ( r f = fi ) s' = ( fi f )' f r iu( r i =( pentru o caracteristic alternativ. Selecia stratificat. 1ac populaia statistic nu este suficient de omogen se utilizeaz selecia stratificat. 5n acest caz populaia se mparte n 6 subpopulaii i (i =( ' ... k ) numite straturi pentru care este satisfcut condiia de omogenitate i din fiecare strat i se e$trage o selecie simpl de volum ni . 5n funcie de raportul dintre volumele seleciilor ni i volumele straturilor corespunztoare N i selecia stratificat poate fi# ! selecie stratificat simplu caz n care# Ni n i ) i = ( ' ... k ) N n ! selecie stratificat proporional caz n care) Ni n = i ) i = ( ' ... k N n sau
ni = N i n ) i = ( ' ... k ) N

selecie stratificat optim caz n care ni nk n( n' N N N( N = ' = ... = i = ... = k ( ' i k

sau

ni = n

N i i

N
j =( j

) i = ( ' ... k
j

unde i este abaterea medie ptratic a stratului ceea ce e$prim faptul c i repartizarea pe straturi a volumului de eantioane se face n raoort cu gradul de variaie al straturilor. Cu a+utorul datelor de observaie se pot calcula pentru fir7ecare strat i ' s media de selecie x i i dispersia de selecie i n cazul caracteristicilor nealternative i respectiv f i i f i (( f i ) n cazul caracteristicilor alternative. %edia de selecie a eantionului global x pentru caracteristicile nealternative i f pentru caracteristicile alternative se determin astfel#

x=

xi N i
i =( k

N
i =(

f =

f N
i =( k i

N
i =(

%. &aportul dintre repartiia statistic i repartiia teoretic "roblema determinrii diferitelor caracteristici ale unei populaii statistice este rezolvat din punct de vedere practic n momentul n care au fost determinate repartiiile lor teoretice. 0 deosebit importan prezint cazul n care funcia de selecie tinde n probabilitate ctre o limit bine determinat) cea mai simpl funcie de selecie este funcia empiric de selecie sau funcia de repartiie de selecie. 5n ipoteza c se efectueaz o selecie de volum n obinnd rezultatele x( x ' ... x n funcia de repartiie a variabilei aleatoare discrete cu repartiia#

x( X # n( n

x' n' n

. . . xk n . . . k n

n
i =(

ni

=(

se numete funcie empiric de selecie i se noteaz cu Fn ) valorile observate privind caracteristica (variabila) * au fost ordonate cresctor (sau descresctor) i s!a reinut o singur dat fiecare valoare xi mpreun cu frecvena sa ni . "roblema convergenei funciei empirice de selecie Fn ctre funcia teoretic de repartiie este o problem fundamental astatisticii matematice. %enionm fr a intra n detalii dou aspecte eseniale n acest conte$t. "rimul aspectse refer la rematcabila contribuie adus de Cantelli care a tratat cazul urnei lui 8ernoulli i a concluzionat faptul c frecvene tinde n probabilitate ctre probabilitate) mai e$act dac p este probabilitatea de a e$trage o bil alb deci probabilitatea unei probe n cazulrepartiiei binomiale i f n = este
n

frecvena corespunztoare n n e$tracii succesive atunci# lim P (9 p 9 < ) = ( oricare ar fi > : . n


n

;l doilea aspect se refer la teorema lui <liven6o (teorema fundamental a statisticii matematice) care e$pliciteaz rolul metodei seleciei i se enun astfel#

1ac F # R >: (= este funcia de repartiie a unei repartiii teoretice iar Fn # R >: (= este funcia empiric de repartiie obinut printr!o selecie de volum n atunci# P ( lim sup 9 Fn ( x) F ( x ) 9 = :) = ( . n <x < %. 'naliza statistic a datelor de observaie "rima problem a statisticii matematice const n stabilirea metodelor de culegere i grupare (dac volumul datelor este foarte mare) a informaiilor statistice. ; doua problem const n elaborarea metodelor de analiz a datelor statistice n funcie de scopul cercetrii. /alorile unei caracteristici a unitilor care formeaz populaia statistic pot fi numere raionale sau numere reale cuprinse ntr!un interval. 5n funcie de valorile pe care le pot lua caracteristicile sunt# ! discrete dac iau numai anumite valori pe scara lor de variaie) ! continue dac pot lua orice valori pe scara lor de variaie. 1ac populaia cercetat o mprim n grupe de uniti cu aceeai valoare a caracteristicii putem determina frecvena unor asemenea grupe e$primat n valori absolute sau relative dac volumul ntregii populaii este considerat egal cu unitatea sau cu (::. ;m vzut c frecvenele relative mpreun cu valorile corespunztoare ale caracteristicii studiate constituie repartiia statistic a caracteristicii studiate n cadrul populaiei date. E(emplul 1. &epartiia statistic a unei caracteristici discrete Considerm situaia n care populaia cercetat este mulimea familiilor compuse din ? persoane care poate fi mprit n @ grupe dup numrul persoanelor active din familie. &umrul unitilor unei grupe ni (i =( @) este frecvena absolut a acelei grupe n cadrul populaiei totale iar raportul dintre frecvena absolut i volumul populaiei este frecvena relativ f i (i =( @) calculat n procente. 1ac datele rezultate din cercetarea populaiei menionate sunt coninute n primele dou coloane ale tabelului de mai +os atunci frecvena relativ este coninut n coloana a treia a tabelului i va fi# &umrul persoanelor active din familie ($) : ( ' A ? Eotal &umrul familiilor alc! tuite din patru persoane (ni) '.::: ('.::: '?.::: B.::: A.::: @:.::: 4recvena relativ (fi) ? :: '? :: ?C :: (C :: D :: (::

fi =

ni

n
i =(

(:: ) (i = ( @)
i

,eprezentarea grafic a datelor de observaie prezint o importan deosebit pentru studiul repartiiilor statistice. Fn ipoteza c au fost nregistrate valorile x( x ' ... x n ale caracteristicii discrete * cu frecvenele relative f ( f ' ... f n unind punctele ( xi f i ) prin segmente de dreapt n planul variabilelor ( x f ) se obine poligonul frecvenelor relative iar prin unirea punctelor ( xi ni ) ni fiind frecvenele absolute se obine poligonul frecvenelor absolute. Observaie. "oligonul frecvenelor relative pote fi considerat ca poligonul frecvenelor absolute dac se modific convenabil unitatea de msur pe a$a ordonatelor.

4ig.(. "oligonul frecvenelor relative

4ig.'. "oligonul frecvenelor absolute. 1eseori se utilizeaz pe lng frecvenele simple (relative sau absolute) i frecvenele cumulate (relative sau absolute) ale unei variante (selecii) xi (i =( n) ca sume ale frecvenelor tuturor valorilor mai mici (sau mai mari) dect xi.

,eprezentm n figura A poligonul frecvenelor relative cumulate ceea ce reprezint curba (graficul) funciei de repartiie i n figura ? poligonul frecvenelor absolute cumulate.

4ig.A. "oligonul frecvenelor relative cumulate

4ig.?. "oligonul frecvenelor absolute cumulate E(emplul !. &epartiia statistic a unei caracteristici continue 1ac numrul variantelor distincte ale caracteristicii cercetate este prea mare atunci pentru a nu frmia prea mult populaia repartiia se prezint pe intervale de variaie (clase). "resupunem c o secie a unei firme are (:: de maini unelte) numrul reperelor de un anumit tip realizate n timpul unui sc.imb (C ore) sunt date ntr!un tabel (sunt deci cunoscute valorile xi (i =( (::) ). -e pune problema s se determine repartiia celor (:: de maini unelte dup numrul pieselor realizate. "resupunem de asemenea c valorile xi (i =( (::) sunt cuprinse ntre ': i B: deci amplitudinea variaiei este , G $ma$ $min G B: ! ': G H:. Considerm c sunt suficiente H intervale egale de mrime . G (: (mrimea intervalului de grupare se calculeaz deseori cu a+utorul formulei h = ( x ma$ x min ) I(( + A A'' lg n) ) caz n care repartiia empiric continu rezult fr dificultate) n ipoteza c cele H intervale nc.ise la stnga i desc.ise la dreapta n care se gsesc valorile xi (i =( (:) sunt date n prima coloan a tabelului urmtor iar n cea de a doua coloan sunt frecvenele absolute corespunztoare (numrul de maini unelte care

realizeaz un numr de repere cuprinse n intervalul corespunztor) atunci frecvenele relative i frecvenele relative cumulate sunt cuprinse n coloanele A i ?. Jimita de intervale &umr maini 4recvena relativ 4recvena relativ x i (numr de f i = ni I n cumulat unelte ( ni ) repere) ':!A: @ : :@ : :@ A:!?: (@ : (@ : ': ?:!@: ': : ': : ?: @:!D: A: : A: : H: D:!H: (@ : (@ : C@ H:!C: (: : (: : B@ C:!B: @ : :@ ( :: Eotal (:: ( :: ! %enionm faptul c determinarea intervalului de grupare este o problem de mare importan pentru evidenierea trsturilor eseniale cu a+utorul gruprilor statistice. 1e obicei numrul de intervale este cel puin egal cu @ i evident nu depete numrul observaiilor. "entru caracteristicile continue se constuiesc )istograma frecvenelor relative i )istograma frecvenelor absolute. "resupunnd c lungimea intervalului de grupare este h i c f i reprezint frecvena relativ a valorilor caracteristicii care aparin intervalului parial de rang i pentru intervalul de rang i se construiete dreptung.iul de nlime f i I h (raportul f i I h se numete densitatea frecvenei relative) i baza h) aria acestui dreptung.i este h f i I h = f i iar aria .istogramei frecvenelor relative este

f
i

= ( ) poligonul frecvenelor relative se obine unind

prin segmente de dreapt mi+loacele bazelor superioare ale dreptung.iurilor care formeaz .istograma frecvenelor relative deci punctele de coordonate (( 'i () h I ' f i I h) . ;nalog se obine .istograma frecvenelor absolute cu meniunea c nlimea dreptung.iului construit pe intervalul de rang i este ni I h deci aria acestui dreptung.i este h ni I h = ni iar aria .istogramei frecvenelor absolute este egal cu

n
i

=n

adic volumul populaiei studiate. "oligonul frecvenelor absolute se obine analog poligonului frecvenelor relative. "entru e$emplul prezentat rezult urmtoarele .istograme i poligoane.

4ig.@. Kistograma frecvenelor relative. "oligonul frecvenelor relative.

4ig.D. Kistograma frecvenelor absolute. "oligonul frecvenelor absolute.

4ig.H. Kistograma frecvenelor relative cumulate. (4uncia de repartiie)

E(emplul %. &epartiia statistic bidimensional 5n cazul n care unitile unei populaii statistice prezint dou sau mai multe caracteristici frecvenele se refer la mai multe caracteristici i repartiiile statistice sunt multidimensionale. 4recvena variaz n acest caz n raport co dou sau mai multe caracteristici. "entru cazul a dou caracteristici * i L se obine repartiia bidimensional de tipul urmtor# Eotal M(...M+...Mm (ni.) $( $i n((...n(+...n(m n(. ni.

n6. $6 Eotal(n.+) ni(...ni+...nim n6(...n6+...n6m n.(...n.+...n.m n

;dunnd frecvenele pe linii sau coloane se obin repartiiile unidimensionale numite i marginale# yj xi X # ) Y # n n . j j =( ' ... m i . i =( ' ... k

You might also like