You are on page 1of 21

3/23/2016

Distribuții de probabilitate utilizate în audit

Distribuţia binomială
Cea mai importantă caracteristică a unui experiment aleator binomial
este faptul că există doar două rezultate posibile, care sunt calificate,
convenţional, prin succes sau eşec.
Exemple:
• la aruncarea unei monede rezultă cap sau pajură;
• un candidat electoral este votat sau nu;
• un produs fabricat este corespunzător sau rebut;
• un angajat este bărbat sau femeie;
• la revizia contabilă, o factură este corectă sau incorectă.
Un experiment binomial posedă următoarele proprietăţi:
• experimentul constă într-un număr fix de încercări (n);
• rezultatul fiecărei încercări poate fi clasificat în una din cele două categorii:
succes sau eşec;
• probabilitatea (p) a succesului rămâne constantă pentru fiecare încercare;
• fiecare probă a experimentului este independentă de celelalte probe ale
acestuia.

1

3/23/2016

Distribuţia binomială
Variabila aleatoare binomială indică numărul de succese în n încercări
independente ale unui experiment binomial
O variabilă aleatoare discretă binomială X se supune unei legi de
probabilitate binomială cu doi parametri: n si p :
X ~ B(n, p)
⋅ 1−
=

=

, ∀ ∈ {0, … 1, … , }

=

0,

ă

unde
n – numărul încercărilor;
p – probabilitatea succesului
q = (1 - p) – probabilitatea eșecului
p+q=1
Formula lui p(x) descrie corect o funcţie de probabilitate deoarece:
1. ∀ ∈ , ≥ 0
2. 2. ∑ ∈
1−
=1
Indicatorii numerici ale unei variabile aleatoare binomiale X ~ B(n,p) sunt:
• media
E(X)=np
• dispersia
V(X)=np(1-p)= npq

Distribuţia binomială
Exemple de experimente binomiale în audit:
 Testarea de către auditor a 500 de facturi selectate aleator din totalul anual al
acestora, la o firmă, pentru a verifica dacă au toate semnăturile necesare (sunt
în conformitate cu criteriile prestabilite). Numărul de încercări ale
experimentului este n = 500; fiecare încercare (verificarea unei facturi
selectate) are două rezultate posibile: corespunde sau nu criteriilor.
Presupunând că rata (ponderea) celor care nu corespund criteriilor este de 1%
şi calificând apariţia unui astfel de caz ca succes, probabilitatea succesului este
p = 0.01 şi cea a eşecului q = (1-p) = 0.99. Deoarece facturile au fost selectate
aleator pentru verificare, cele 500 de încercări sunt independente. Variabila
aleatoare care înregistrează numărul de succese observate în cele n=500
încercări este numită variabilă aleatoare binomială.
 Verificarea de către un auditor a unui eşantion aleator de 100 de persoane ale
unei companii cu privire la corespondenţa dintre categoria de calificare şi
categoria lucrărilor pentru care au fost salarizaţi. Experimentul este compus
din n = 100 de încercări; fiecare încercare (verificarea corespondenţei pentru
fiecare persoană selectată) are două rezultate posibile: corespondenţa există
sau nu. Dacă presupunem că în 80% dintre cazuri corespondenţa este reală,
atunci p = 0.8, iar q = (1-p) =0.2; încercările sunt independente iar variabila
care înregistrează numărul de corespondențe reale (succese) este o variabilă
aleatoare binomială.

2

p = 0.00001 3 . pe măsură ce valoarea lui n creşte. • dacă p=0. Pentru un p dat. • dacă p →1 distribuţia este asimetrică spre stânga (b).8 (c) n = 10.00810 4 0. fiecare fiind considerat un succes.00045 5 0.5. distribuţia este asimetrică spre dreapta (a). p = 0. Dacă notăm cu X numărul de succese obținute pe parcursul experimentului.2 (b) n = 10.3/23/2016 Distribuţia binomială Particularităţile unei distribuţii binomiale sunt prezentate în graficele următoare: • dacă p → 0. 1/10) x p(x) 0 0. deci putem scrie: X ~ B (5.32805 2 0.07290 3 0. poligonul frecvenţelor ia progresiv aspectul unei curbe. Aplicație Exemplu: Dintr-o urnă cu 10 jetoane cu valori de la 1 la 10 euro. extragem (conform procedeului bilei revenite al lui Bernoulli) 5 jetoane și calculăm numărul de jetoane cu valoarea de 10 euro.59049 1 0. (a) n = 10. cu n = 5 și p = 1/10 ca parametri. atunci X este o variabilă binomială care urmează o lege de probabilitate binomială. distribuţia este simetrică (c). p = 0.5 Distribuţia binomială .

• probabilitatea ca un succes să apară într-un anumit interval este aceeaşi pentru toate intervalele de mărime egală şi este proporţională cu mărimea intervalului. asteptat). Un mod alternativ de a prezenta o distribuţie binomială utilizează probabilităţile cumulate care reprezintă suma probabilităţilor binomiale de la x = 0 până la x = k (exemplu pentru k = 2: P(X ≤ 2) = ∑ ( ) = p(0)+p(1)+p(2). • numărul fraudelor depistate într-un proces de audit al situaţiilor financiare ale unei firme în decursul perioadei de analiză.000 1. • probabilitatea ca două sau mai multe succese să apară într-un interval tinde spre zero pe măsură ce intervalul devine mai mic. • numărul de succese care apar într-un interval este independent de numărul de succese care apar în oricare alt interval.919 0. Exemple de activităţi la care se poate aplica distribuţia Poisson: • înregistrarea numărului de convorbiri telefonice primite de la un pupitru (tablou de comandă) într-o perioadă specificată de timp. • înregistrarea numărului de sosiri la o locaţie service într-o perioadă dată de timp. • intervalul se referă fie la un interval de timp fie la un interval de spaţiu (arie sau regiune). 4 .991 1.000 Distribuţia Poisson O variabilă aleatoare Poisson reprezintă numărul de evenimente rare (succese) care apar într-un interval de timp sau o regiune specificate.590 0. în mod independent unul faţă de celălalt şi rareori. p şi x şi prezentate în anexa 1. distribuţia binomială cumulativă este următoarea: k 0 1 2 3 4 ( ) 0.3/23/2016 Distribuţia binomială . Avantajul utilizării unui tabel al probabilităţilor binomiale cumulate este acela că ne permite uşor aflarea probabilităţii cu care x va lua o valoare până la un anumit rang k al valorilor (anexa 2). Modelul Poisson se poate aplica atunci când evenimentele de interes apar aleator. Proprietăţile unui experiment Poisson: • succesul se referă la apariţia unui eveniment de interes (dorit. Pentru exemplul anterior. Aplicație Valorile numerice ale lui p(x) = ⋅ 1− sunt calculate pentru un număr reprezentativ de valori ale lui n.

1. într-un experiment Poisson. care are un număr finit de valori posibile. Dacă X este o variabilă aleatoare Poisson pentru care λ este numărul mediu de succese apărute într-un anumit interval. funcţia f : R →R f = 0. ( )≥0 • ∑ ∈ =1 Pentru a utiliza în practică formula distribuţiei de probabilitate Poisson. media şi dispersia acesteia au aceeaşi valoare: E(X) = V(X) = λ 5 ....3/23/2016 Distribuţia Poisson Variabila aleatoare Poisson indică numărul de succese care apar pe durata unui interval de timp dat sau într-o regiune specificată. Valorile tabelare ale probabilităţilor Poisson sunt prezentate în anexa 3 iar cele cumulative sunt prezentate în anexa 4.2. este baza logaritmilor naturali. ă atunci X este o variabilă aleatoare discretă supusă unei legi de probabilitate Poisson de parametru λ. Fie λ > 0. ∀ ∈ ă posedă caracteristicile unei funcţii de probabilitate: • ∀ ∈ . ∀ ∈ ! = 0.. de obicei dintr-o serie de date anterioară (istorică). notată X ~ P0(λ). Variabila aleatoare Poisson este o variabilă discretă cu un număr infinit de valori posibile – spre deosebile de variabila aleatoare binomială. dacă X este o variabilă aleatoare astfel încât: = = . trebuie să obţinem o estimaţie a lui λ. Distribuţia Poisson Pentru λ > 0.71828. • λ reprezintă numărul mediu de succese apărute într-un interval dat de timp sau spaţiu • e = 2. ! . În formula distribuţiei de probabilitate a unei variabile aleatoare Poisson: • = = = ! pentru x = 0.

n este mărimea eşantionului iar p este probabilitatea de apariţie a unei erori. cu atât această aproximare este mai corectă. 6 . eroarea tolerabilă pentru un eşantion de mărime n din populaţie când eşantionul conţine x erori. Media distribuţiei Poisson este dată de expresia: λ = np. p este mic și λ = np. Distribuţia Poisson Auditorii fac inferenţe statistice despre existenţa erorilor sau/şi a fraudelor în înregistrările contabile cu scopul de a exprima o opinie asupra obiectivităţii (corectitudinii) situaţiilor financiare publicate. cu un risc specific. • finalizarea auditului. în acelaşi timp. Procesul de audit cuprinde patru faze: • planificarea şi definirea unei metode de auditare • efectuarea testelor mecanismelor de control şi a testelor substanţiale ale operaţiunilor – deoarece aceasta fază vizează caracterul adecvat al mijloacelor şi metodelor de control se utilizează sondajul de atribute pentru a estima rata (ponderea) erorilor în populaţie. Distribuţia Poisson permite auditorului să precizeze.05. Cu cât valoarea lui n este mai mare şi cea a lui p este mai mică. în practică se consideră valabilă aproximarea dacă:  n ≥ 50 şi  np ≤ 10 sau p < 0. unde λ este media.3/23/2016 Distribuţia Poisson Contextul utilizării practice a unei variabile aleatoare supuse legii de probabilitate a lui Poisson se poate defini astfel: Fie X ~ B(n. n este mare.p) • dacă n → ∞ (n este mare) • şi p → 0 (p este mic) • atunci X ~ P0(λ ) unde λ = np Acest enunţ ne permite să considerăm legea Poisson ca o aproximare a legii binomiale pentru care. • efectuarea procedurilor analitice şi a testelor detaliilor soldurilor – se utilizează sondajul de variabile pentru a estima magnitudinea erorilor şi/sau defalcarea cauzată de neconcordanţele în mijloacele şi metodele de control.

998.2% dintre înregistrările contabile ale creanţelor-clienţi conţin erori monetare. Dacă actuala echipă de audit selectează aleator un eşantion de 500 de înregistrări: a) care este probabilitatea să găsească exact trei erori de acest tip? n = 500.0.002 = 1 ≤10 (p=0. în special în detectarea fraudelor. Utilizarea distribuţia Poisson în astfel de cazuri: • observând că distribuţia Poisson este potrivită pentru populaţii în care rata de apariţie a unui eveniment (eroare) este extrem de scăzută.m. a căror frecvenţă de apariţie este foarte mică (≤ 1 la 1 milion). dimensiunea optimă a eșantionului în acest caz este cu mult mai mică decât cea necesară în sondajul clasic de variabile.0613 6.002).002 .la intersecția coloanei λ = 1 și a rândului x = 3) b) care este probabilitatea să găsească mai mult de două erori de acest tip? Considerând X ~ P0(1) ⇒ P(X>2) = 1 . odată selectată.0. se consideră că doar 0. Observăm că: n ≥ 50 np = 500*0. a cărui parte este • rezultatul este acela că probabilitatea de selecţie în eşantion devine proporţională cu mărimea (de exemplu. X = numărul de erori monetare ⇒ X ~ B(500.002<0.92 = 0.002) ~ P0(λ ) ~ P0(500*0.0.) • pornind de la presupunerea că rata inferioară a erorii în populaţie este zero.P(X ≤2) =1 . acţionează ca un magnet pentru a extrage o factură. o factură de 1 milion u. Aplicație Exemplu: Pe baza datelor de la ultimul audit extern efectuat la o companie. are de 1 milion de ori şanse mai mari să fie extrasă pentru examinare decât una de 1 u.13% (anexa 3 . unitatea monetară individuală este definită ca unitate de sondaj (nu un cont din balanță sau o factură) • fiecare unitate monetară din populaţie are o şansă egală de a fi selectată (sunt echiprobabile) şi. p = 0. Distribuţia Poisson. s-a dezvoltat un demers statistic specializat (PPD = probabilitate proporţională cu dimensiunea sau SUM = sondaj de unităţi monetare) • în cadrul acestui tip de demers.002) ~ P0(1 ) unde λ = np ⇒ P (X=3) = 0.m. q = (1-p) =0. utilizarea în audit a sondajului clasic (de atribute sau de variabile) a devenit necorespunzătoare sau ineficientă în anumite cazuri.080 = 8% (anexa 4 – la intersecția coloanei λ = 1 și a rândului k = 2) 7 .05) ⇒ X ~ B(500.3/23/2016 Distribuţia Poisson În prezent. cont etc.

în special în activitatea de audit cu ajutorul metodelor statistice. În cadrul acestei formule: • numărătorul este produsul dintre numărul de moduri în care se pot selecta x succese într-un eşantion aleator din cele M succese din populaţie şi numărul de moduri în care se pot selecta cele (n-x) insuccese într-un eşantion aleatoriu din cele (N-M) insuccese prezente în populaţie. binomială şi Poisson. doar distribuția de probabilitate hipergeometrică asigură independența extragerii unităților care vor compune eșantionul.3/23/2016 Distribuţia Hipergeometrică Primele distribuţii discrete prezentate. • când dimensiunea eșantionului este relativ mare în comparație cu dimensiunea populației. aproximând corect distribuția reală de probabilitate a variabilei aleatoare discrete de interes în auditul statistic. Condițiile de aplicabilitate în audit a distribuției de probabilitate hipergeometrică: • când eșantionarea se face fără revenire (nerepetat) dintr-o populație finită. 8 . sunt foarte utile în multe procese decizionale în domeniul economic şi social. Distribuţia Hipergeometrică Pentru cazul în care există doar două rezultate posibile la o încercare (variabila este alternativă). probabilitatea hipergeometrică se calculează pe baza formulei: = = = ∙ Unde: N = dimensiunea populaţiei n = dimensiunea eşantionului M = numărul de succese în populaţie x = numărul de succese în eşantion. • numitorul reprezintă numărul de moduri în care se poate selecta un eşantion aleator nerepetat de dimensiune n dintr-o populaţie de dimensiune N. dar ambele necesită ca încercările (probele) să fie independente. În aceste cazuri.

M.2 … =1 Distribuţia Hipergeometrică ∑ Folosind următoarea relaţie: ∙ = Se pot determina indicatorii numerici ai unei astfel de variabile aleatoare: Media = ∙ Dispersia ( − )( − ) ∙ ( − 1) Observație: în aplicaţiile de audit. = 0. acest tip de caracteristică este adesea nedorită (varianta pe care am numit-o succes este de cele mai multe ori o eroare sau fraudă depistată într-o procedură de audit). 2. = ∙ 9 . 1.1.…n.3/23/2016 Distribuţia Hipergeometrică O variabilă aleatoare care urmează o distribuţie hipergeometrică se notează astfel: X ~ H (n. N) sau ~ ∙ x = 0. numărul M este adesea relativ mic dar el trebuie cunoscut pentru a putea folosi acest tip de distribuţie de probabilitate. n N Se demonstrează simplu că probabilităţile = = ∙ = posedă caracteristicile unei funcţii de probabilitate: ≥ 0.

decidenţii din auditul statistic utilizează de obicei distribuţia binomială ca o aproximare a celei hipergeometrice (calculele sunt mai simple şi rezultatele obţinute sunt sensibil apropiate în aceste cazuri). se foloseşte distribuţia hipergeometrică.3/23/2016 Distribuţia Hipergeometrică. iar elementele eşantionului au fost selectate fără revenire. 10 . a) Care este probabilitatea ca în eşantionul selectat (nerepetat) să nu fie nici o factură eronată? Putem considera că variabila aleatoare numărul de facturi eronate din eşantion (X). M=2 N = 20 n = 10 x = numărul de facturi eronate din eşantion =0 = ∙ = 0.2368 1 0. a ales aleator jumătate dintre aceste facturi pentru a le verifica. Cu toate acestea. Aplicație Exemplu: La controlul intern dintr-o companie. deoarece dimensiunea eşantionului este mare comparativ cu cea a populaţiei (n/N =10%). auditorul extern care îşi desfăşura activitatea la companie. Deşi nu există o regulă precisă pentru cazurile în care aproximarea binomială poate fi utilizată.2368 b) Care este probabilitatea ca în eşantionul selectat (nerepetat) să fie o factură eronată? =1 = ∙ = 0.2368 =1 Distribuţia de probabilitate hipergeometrică a numărului de facturi eronate din eşantionul aleator şi nerepetat format din 10 facturi este: Notă: x P(x) 0 0. de obicei se foloseşte atunci când dimensiunea eşantionului este sub 5% din cea a populaţiei. atunci când dimensiunea populaţiei este relativ mare faţă de cea a eşantionului. două sunt întocmite necorespunzător. în aceeaşi zi. urmează o distribuţie de probabilitate hipergeometrică. în celelalte cazuri. Aplicație c) Care este probabilitatea ca în eşantionul selectat (nerepetat) să fie ambele facturi eronate? =2 = ∙ = 0.5264 Distribuţia Hipergeometrică.2368 1.5264 2 Total 0. managerului i s-a adus târziu la cunoştinţă că dintre cele 20 de facturi cu valoare peste 100000 euro.0000 Notă: distribuţia hipergeometrică este folosită în situaţiile în care eşantionarea se face fără revenire dintr-o populaţie finită.

Este distribuţia fundamentală a inferenţei statistice. = 2. distribuţia binomială). reprezentând distribuţia posibilelor estimări ale unui parametru al populaţiei care pot apărea în diferite eşantioane. greutatea unui grup de persoane. 3. vânzările anuale ale unei firme. unde – media lui X. = .este continuă.14159 … . În astfel de cazuri valorile observate tind să se aglomereze într-un mod simetric în jurul valorii centrale. 2.are două puncte de inflexiune. dând naştere unei curbe în formă de clopot.este simetrică în raport cu = .∞ și + ∞. . • Funcția normală a densității de probabilitate f(x): .are valori pozitive pentru toate valorile lui x. = + 11 . inclusiv distribuţii discrete (de exemplu. .∀ ∈ unde = . 1. Asigură o aproximare utilă pentru numeroase alte distribuţii. .dispersia lui X Funcția normală a densității de probabilitate : = ∙ . . măsurarea erorilor care apar la realizarea unui experiment.71828 … Proprietățile funcției normale a densității de probabilitate : • Variabila normală poate lua orice valoare reală între . Distribuţia normală O variabilă aleatoare X care este normal distribuită se numeşte variabilă aleatoare normală.3/23/2016 Distribuţia normală Legea normală de probabilitate (legea Gauss-Laplace) este cea mai importantă lege de probabilitate.posedă un punct de maximum pentru . în = = şi − şi în = . Modelează şi descrie într-un mod folositor numeroase variabile aleatoare pe care le întâlnim în practică: înălţimea. ~ . notele elevilor dintr-o clasă. = 3.

Aceeași valoare a dispersiei dar valori diferite ale mediilor Aceeași valoare a mediei dar valori diferite ale dispersiilor Distribuţia normală Cea mai importantă distribuţie din familia distribuțiilor normale este distribuţia normală standard.1) .3/23/2016 Distribuţia normală Cu toate că o distribuţie normală este complet determinată odată cu specificarea celor doi parametri şi . În mod uzual sunt două tabele: • primul tabel cuprinde probabilitățile P(0 ≤ Z ≤ z) – anexa 5 • al doilea tabel cuprinde probabilitățile P(Z ≥ z) pentru valori pozitive ale lui z precizate la două zecimale – anexa 6 Valoarea lui P se găseşte la intersecţia liniei corespunzătoare părții întregi şi primei zecimale a lui z cu coloana corespunzătoare celei de a doua zecimale a lui z.1) sunt precalculate în tabele speciale utilizate pentru calculul probabilităților pentru orice variabilă normală. care are media = 0 şi dispersia = 1. Utilizarea tabelelor distribuției normale stanard Valorile distribuției normale standard Z~N(0. în realitate. există o întreagă familie de distribuţii normale care au aceeaşi formă (clopotul lui Gauss) dar diferă una de cealaltă prin valorile mediei și dispersiei. Orice variabilă normală ~ .este distanţa de la fiecare valoare inițială (x) a variabilei normale (X) înainte de standardizare până la media sa ( ). = poate fi astfel standardizată: Z ~ N(0. 12 . măsurată în număr de abateri standard ( ).

03983 0.3/23/2016 Distribuţia normală.1) z 0.1 0.03188 0.33147 0. 60 − 60 − 60 70 − 60 60 < < 70 ⇒ < < 8 8 8 ⇒ 60 < < 70 = 0 < < 1.33398 0.10257 0. Dacă auditorul verifică (din evidenţele companiei) timpul necesar pentru un anumit angajat.38686 0.01994 0.0 0.22240 0.27637 0.29955 0.40320 0.30511 0.22907 0.5 0.05172 0.23565 0.01595 0.26730 0.2 1.30234 0.36650 0.40490 0.06356 0.34134 0.6 0.25490 0.06 0.18439 0.7 0.34375 0.40988 0.20884 0.19146 0.36864 0.00000 0. pe baza rezultatelor controlului intern.37286 0.03586 0.16276 0.37493 0. managerul unei companii afirmă.41149 0.40658 A doua zecimală a lui z 0.21904 0.17003 0.39617 0. Aplicația 1 Exemplul 1: În cadrul unui proces de audit.10642 0.37698 0.04380 0.33891 0.01197 0.00 0.08 0.25804 0.4 0.01 0.39796 0.28230 0.41774 13 .05 0.23891 0.02790 0.0 1.03 0.17364 0.20540 0.07535 0.18082 0.18793 0.35993 0.30785 0.00399 0.39065 0.35769 0.19847 0.19497 0.37900 0.17724 0.04776 0.09095 0.21226 0.02 0.39435 0. deoarece probabilitatea ca o variabilă aleatoare continuă X să ia o valoare particulară este zero.12930 0.26115 0.11409 0. Aplicația 1 1 TheDistribuţia Normal distribution.13683 0.41621 0.32894 0.32381 0. dorim calculul următoarelor probalilităţi: a) probabilitatea ca un angajat să realizeze operațiunea într-un interval cuprins între 60 şi 70 de minute.35543 0.11791 0.34849 0.32639 0.39251 0.21566 0.37076 0.02392 0.32121 0.09483 0.31327 0.31057 0.04 0.28524 0.16640 0. că durata în care angajaţii realizează o anumită operaţiune este cunoscută ca fiind normal distribuită.25175 0.27035 0.8 0. Pentru a putea utiliza tabelul distribuţiei normale (anexa 5) trebuie să transformăm variabila normală X din exemplul nostru în variabilă normală standard Z. b) probabilitatea ca un angajat să realizeze operațiunea în mai mult de 70 de minute.15542 0.11026 0.07926 0.33646 0.29389 0. c) probabilitatea ca un angajat să realizeze operațiunea într-un interval cuprins între 50 şi 70 de minute.39973 0.15910 0.29673 0.31859 0.20194 0.40147 0. probabilitatea pe care ne-am propus să o aflăm este: P(60 ≤ X ≤ 70) sau P(60 < X < 70).12552 0.24537 0.31594 0.27935 0.14431 0.14803 0.38298 0.28814 0.14058 0.35083 0.36433 0.12172 0.3 0.22575 0. normală.35314 0.1 1.2 0.3 0.06749 0.27337 0.3944 = 39.13307 0.05962 0.24857 0.29103 0.38877 0. cu o medie de 60 de minute şi o abatere standard de 8 minute.26424 0.44% Distribuția Z: N(0.07 0.41466 0.15173 0.24215 0.38493 0.07142 0.9 1.38100 0.09871 0. d) probabilitatea ca un angajat să realizeze operațiunea într-un interval cuprins între 65 şi 70 de minute.25 = 0.09 0.40824 0.08317 0.08706 0.41309 0.36214 0. Application a) Notăm cu X timpul necesar pentru realizarea operațiunii.23237 0.05567 0.34614 0.00798 0.

2177 0. Valoarea lui A2 am calculat-o la punctul a şi.25 0. putem calcula probabilitățile dorite astfel: Metoda 1: > 1.25 ⇒ Z ≥ 1.25 = = 0.3156 0.1251 0.1736 0.2236 0.2358 0.1056 P(Z ≥ z) z 0.1170 0.3050 0.3557 0.2327 0.3707 0.1 0. ea trebuie determinată ca sumă a celor două suprafeţe situate de o parte şi de alta a mediei.1 1.1190 0.1446 0.09 0. Valoarea corespunzătoare suprafeţei A2 am găsit-o anterior: 0.15 0. Deoarece aria totală de sub curba normală este egală cu unitatea.3859 0.3594 0.1314 0.4 0.1788 0.3264 0.2266 0.2 1.3944 = 0.3936 0.3483 0.06 0.0985 0.1151 0.1075 0.1112 0.4247 0.2451 0.6 0.05 0 -4 -3 -2 -1 0 A1 1 2 3 4 Distribuţia normală.1685 0.3 0.07 0.1230 0.3015 0.2 0.3944.1056 0.3632 0.4840 0.1515 0.0968 0.0 1.2676 0. Aplicația 1 1 TheDistribuţia Normal distribution.0934 A doua zecimală a lui z 0.3 0.3300 0.1469 0.1056 Metoda 2: Utilizând anexa 6 P(Z ≥ z) : > 1.2709 0.8 0.3944 = 0.1038 0.1611 0. datorită simetriei distribuţiei normale A1 =A2 0.5 − 0.4129 0.3745 0.2611 0.2389 0.4090 0.1379 0.1762 0.2578 0.1949 0.02 0.1814 0.7888 = 78.1093 0. Probabilitatea dorită este: −1.1492 0.04 0.25.5 − = 0.3 0.2 0.4562 0.0853 0.1867 0.3 0.05 0.08 0.4920 0.4761 0.1587 0.3520 0.0951 0.25 = 0.35 0.3897 0.3372 0.0 0.4207 0.1539 0.3974 0.1660 0.1020 0.4721 0.1635 0.1335 0.4641 0.00 0.3409 0.2483 0.1894 0.1841 0.3669 0.2061 0.3085 0.1003 0.2296 0.25 În figura următoare sunt prezentate grafic cele două suprafeţe de interes: • A1 corespunde probabilității dorite: Z ≥ 1.25 < < 1.4013 0.4052 0.1 0.2206 0.25 • A2 corespunde probabilității : 0<Z<1.3121 0.0823 0.2119 0.2743 0.1562 0.0869 0.25 = + = = 2∙ = 2 ∙ 0.4325 0. Aplicația 1 c) 50 < X < 70 ⇒ < < ⇒1.4168 0.4 0.88% Obs.25 De fiecare dată când aria de interes include media.2546 0.3821 0.0838 0.4443 0.4404 0.2005 0.4286 0.4681 0.1271 0.2843 0.1977 0.2877 0.3446 0.4602 0.25 0.3336 0.4960 0.2148 0.05 0 -4 -3 -2 -1 0 1 2 3 4 14 .3/23/2016 normală.2033 0.2946 0.5 0.2981 0.4483 0.4801 0.2810 0.2643 0.4880 0.1711 0.7 0.35 0.1922 0.0901 0.2776 0.1210 0.4522 0.3783 0. Application b) X > 70 ⇒ > =1.9 1.1423 0.1131 0.5000 0.2 0.0918 0.15 0.25 < < 1.2514 0.2420 0.4 0.2912 0.1401 0.3192 0.1292 0.3228 0.03 0.2090 0.4364 0.1357 0.01 0.0885 0.1 A2 0.

Aplicația 1 d) 65 ≤ ≤ 70 ⇒ < < ⇒ 0.2357 = 0.4 2. Rezolvare 1. .25 0. altfel spus calculăm echivalentul salariului său într-o distribuţie N(0. managementul companiei.25 − 0 < < 0. Auditorul.1587 0.25 = 0 < < 1. În acest caz este angajatul filialei B . = 0.şi unul de la filiala B care a obţinut în aceeaşi perioadă un salariu de 7. îşi propune să determine care dintre cei doi angajaţi este mai bine clasat în raport cu ceilalţi colegi din filiala sa şi dacă această ierarhie corespunde normelor în vigoare.3944 − 0.1): • pentru angajatul filialei A: .4 u.9.05 0 -4 -3 -2 -1 0 1 2 3 4 Distribuţia normală.2 0.35 0. Standardizăm salariul fiecărui angajat. furnizează următoarele informaţii: salariile obţinute de angajaţii primei filiale (A) sunt distribuite după o lege normală N(7.15 0. 15 .2 • pentru angajatul filialei B : = 0.81) iar cele ale angajaţilor celei de a doua filiale (B) sunt normal distribuite N(6.1 0. .m. considerând un angajat de la filiala A care a obţinut în ultima lună un salariu de 7..m.2. Aplicația 2 Exemplul 2: Pentru verificarea procedurilor privind salarizarea la o companie. Comparăm valorile standardizate. ea se poate determina ca diferenţă între ariile a două suprafeţe ale căror probabilităţi se găsesc în anexa 5.0.3 u.63 < < 1.63 = 0. . auditorul compară două filiale ale acesteia. Cel mai bine clasat în raport cu colegii săi este angajatul cu cea mai mare notă standardizată.63 < < 1. 0.25 Probabilitatea dorită corespunde suprafeţei haşurate din figură.3/23/2016 Distribuţia normală. pe baza unor studii anterioare.4 0. .1).3 0.

Cum această teoremă se aplică oricărei sume de variabile aleatoare independente între ele şi identic distribuite..X2. Spunem că este la limită normal distribuită. Proprietăți Proprietăţi ale variabilelor aleatoare normale: • dacă X este o variabilă aleatoare normală iar a este o constantă. astfel încât: .. indiferent de forma distribuției. putem enunţa următoarea teoremă referitoare la suma a mai mult de două variabile normal distribuite: Fie X1.. aceeaşi medie . dacă n→ ∞): → ~ . unde: = +⋯+ = =∑ + ⋯+ =∑ Distribuţia normală Teorema limită centrală Fie X1. ∀ ∈ 1.Xn n variabile aleatoare independente unele faţă de altele.. cu media și dispersia . .. şi dispersie - ). atunci variabilele: X+a. Prin generalizare.3/23/2016 Distribuţia normală. X-a şi aX sunt şi ele normal distribuite.. X2. Şi fie: =∑ / Atunci.. dacă n este mare (teoretic.. … ~ şi fie =∑ atunci ~ . • dacă X şi Y sunt două variabile aleatoare normale şi independente. atunci şi variabilele X+Y şi X-Y sunt normal distribuite. este important să precizăm că ea permite şi aproximarea unei sume de variabile discrete printr-o variabilă continuă (regula aproximării normale).Xn n variabile aleatoare independente între ele şi identic distribuite (aceeaşi distribuție de probabilitate. 16 .

X2. 17 .. ≅ . aşa cum n şi p sunt pentru o distribuţie binomială şi şi pentru o distribuţie normală. Condiţiile de aplicare a unei astfel de aproximări: • cu cât n este mai mare.3/23/2016 Distribuţia normală Putem utiliza această teoremă pentru a aproxima o distribuție binomială cu ajutorul unei distribuții normale: Fie ~ . np ≥ 5 şi nq ≥ 5 . • dacă n are o valoare moderată. . atunci ≅ . . dacă n este mare.. dacă. numărul gradelor de libertate. Distribuţia χ O distribuţie derivată din distribuţia normală cu un rol foarte important în inferenţa statistică este distribuţia (distribuția HelmertPearson): Fie X1. cu atât aproximarea este mai corectă. n ≥ 30 2.Xn n variabile aleatoare independente astfel încât ~ .5 – mai puţin bună dacă p → 0 sau p → 1 În practică se consideră că sunt respectate condițiile: 1. aproximarea este: – foarte bună dacă p →0.. în acelaşi timp. … Dacă = +⋯+ . reprezintă parametrul specific al acestei distribuţii.. ∀ ∈ 1.. atunci X este o variabilă aleatoare continuă care urmează o lege de probabilitate cu n g : ~ Valorile corespunzătoare mediei şi dispersiei acestei variabile X sunt: = =2 Observație: n.

în graficul anterior).4 0.1 0 0 5 10 15 20 25 Distribuţia χ Proprietăți • orice variabilă aleatoare supusă unei legi poate lua doar valori pozitive (fiind definită ca suma pătratelor unor variabile).9 n=1 0. în graficul anterior). curba unei distribuții este total asimetrică (n = 1.2 0.7 0. – din ce în ce mai simetrică. de la 1 la 30) pentru a identifica valoarea lui x pentru care probabilitatea > = 18 .6 0. în graficul anterior).8 n=3 n=10 0. curba ia forma unui clopot: – asimetrică întâi.3 0. 2n). • atunci când n este suficient de mare. pe măsură ce n creşte (n = 10.3/23/2016 Distribuţia χ 0.5 0. forma graficului se apropie de curba unei legi normale: N~ (n . • pentru ≥ 3. pentru valori mai mici ale lui n (n = 3. • pentru n foarte mic. Utilizarea tabelului distribuției χ (anexa 7) În tabelul distribuţiei ~ pornim de la valoarea probabilității  și de la valori ale lui n (uzual.

95 şi căutăm la intersecţia liniei n = 10 cu coloana = 0. dacă > 2 → 1. două variabile aleatoare atunci T este o variabilă aleatoare continuă care urmează o lege de distribuție de probabilitate student cu n grade de libertate: ~ Valorile mediei şi dispersiei pentru variabila T sunt: =0 = . > = 0.940 Distribuţia student (t) Fie Z~ N(0. deducem mai întâi că dacă < = 0. pentru valori mari ale lui n 19 . dacă dorim să aflăm pentru care valoare a lui x.1) și independente.05. Dacă = ~ . Exemple Pentru o variabilă ~ dacă dorim să aflăm pentru care valoare a lui x. găsim această valoare la intersecţia liniei n = 15 şi a coloanei = 0. atunci > = 0.05.996 Pentru o variabilă ~ .05: x = 24. < =0.3/23/2016 Distribuţia χ .05.95 pentru a găsi valoarea dorită: x = 3.

20 . Pentru valori mai mici ale lui n. N(0. tinzând progresiv către cea a lui N(0. sub curbă. când → ∞. forma clopotului este mai largă şi plată.3/23/2016 Distribuţia student (t) Reprezentarea grafică a unei astfel de variabile are aspectul unei distribuţii normale standard N(0.1).1).1) t10 t2 -5 -4 -3 -2 -1 0 1 2 3 4 5 Distribuţia student (t) Utilizarea tabelului distribuției Student (anexa 8) Valorile (t) ale unei variabile T se regăsesc la intersecţia unei linii care precizează numărul gradelor de libertate n cu o coloană care precizează aria a suprafeţei situată la dreapta acestei valori. forma clopotului este mai îngustă şi mai înaltă. iar pe măsură ce valorile lui n sunt mai mari.

05 la intersecţia liniei n = 21 şi a coloanei = 0. ca şi în cazul ditribuţiei normale N(0. grafic) Dacă dorim o valoare negativă a variabilei. 21 . găsim valoarea t pentru care > = 0.1).3/23/2016 Distribuţia student (t) Exemplu Pentru o variabilă ~ .721 (anexa 10. folosim proprietatea de simetrie.05 : t = 1.