CALITATEA PRODUSELOR ŞI FIABILITATEA

7. REGRESIE ŞI CORELAŢIE. ANALIZA
DISPERSIONALĂ. (ANOVA)
7.1. LEGĂTURI STOCASTICE
Legea de repartiţie a unui sistem de variabile aleatoare poate diferi
de cea a componentelor sale între care pot exista sau nu anumite legături.
Acestea pot fi sub forma unor legături evidente (de la cauză la efect) sau
mai puţin evidente.
În primul caz legăturile sunt atât de strânse încât este suficient să se
cunoască valoarea uneia din ele pentru a se determina cu exactitate
valoarea celeilalte (legături deterministe).
În al doilea caz, legătura dintre caracteristicile respective poate avea
un caracter aleator fiind dependentă aleator sau independentă când legătura
este „slabă”. Noţiunea de independenţă trebuie înţeleasă în sensul că
legăturile foarte slabe pot fi considerate practic inexistente.
În general se spune că variabila aleatoare y este independentă de
variabila aleatoare x dacă legea de repartiţie a lui y nu depinde de valorile
lui x.
Noţiunea de dependenţă, referitoare la variabilele aleatoare, are un
sens mai larg decât cea utilizată în tehnică. În mod obişnuit, tehnica
tradiţională înţelege un singur tip de dependenţă, acela al dependenţei totale
sau deterministe.
În cazul a două variabile aleatoare x şi y acestea pot fi legate printr-o
relaţie probabilistică, de exemplu atunci când se cunoaşte probabilitatea lui
x, valoarea lui y nu este cunoscută ci numai legea sa de repartiţie
dependentă de x. În funcţie de tipul variabilelor dependenţa poate fi
stabilită fie prin regresie fie prin corelaţie.
Regresia stabileşte legătura dintre o variabilă deterministă impusă şi
o variabilă aleatoare, iar corelaţia stabileşte legătura între două variabile
aleatoare.
Estimarea legăturilor între diferite variabile ţinând seama de aspectul
aleator, este deosebit de importantă pentru analiza caracteristicilor calităţii
în etapele de concepţie, fabricaţie şi control.
188
CALITATEA PRODUSELOR ŞI FIABILITATEA
7.2. REGRESIA
7.2.1. ASPECTE GENERALE ALE REGRESIEI
Regresia este tehnica generală de a ajusta, cât mai bine posibil, datele
observate la o curbă teoretică dată. Termenul de regresie a fost introdus de
Galton. Metoda cea mai cunoscută este metoda celor mai mici pătrate, care
constă din a exprima că suma pătratelor distanţelor punctelor observate la o
curbă de ajustare este minimă. În cazul a trei variabile procedeul este
similar şi se ajunge la o suprafaţă de ajustare. În cercetare şi proiectare,
acolo unde între anumite mărimi teoria nu poate stabili nici o relaţie de
legătură, metoda regresiei este singura, care poate suplini această lacună
prin prelucrarea unor date experimentale. Metoda regresiei presupune mai
întâi o cercetare experimentală a variaţiei mărimilor respective. Prima etapă
constă din culegerea datelor experimentale şi reprezentarea grafică a
variaţiei mărimilor considerate. Graficul obţinut sugerează tipul de ajustare
care poate fi utilizat.
Regresia poate fi: liniară, neliniară, plană, multiplă.
Etapele de estimare a legăturii:
1- achiziţionarea datelor;
2- reprezentarea grafică a datelor;
3- alegerea tipului de regresie;
4- determinarea parametrilor.
7.2.2. AJUSTĂRI LINIARE
7.2.2.1. Estimarea parametrilor dreptei de regresie
Se consideră două variabile X şi Y între care se presupune că există o
legătură pentru care experimental au fost determinate perechile de valori x
i,
y
i
:
x x
1
x
2
…………… x
n
y y
1
y
2
…………… y
n
Fig.7.1 arată că punctele se înscriu de–a lungul unei linii drepte bazat
pe proprietatea că media teoretică a variabilei aleatoare y, M[y] este o
funcţie liniară de o variabilă cunoscută x:
M[y]=A+Bx (7.1)
A, B – valori adevărate.
189
x
1
x
2
x
n
x
i
M[Y] M[Y]=A+Bx
Regresie şi corelaţie. Analiza dispersională
Fig.7.1 Graficul dreptei de regresie.
Această funcţie este estimată de „dreapta de regresie”.
bx a y + ·
~
(7.2)
unde: a=M[A]; b=M[B].
Valorii experimentale y
i
îi corespunde pe dreapta de regresie
valoarea estimată,
y y M
~
] [ ·
.
i i
bx a y + ·
~
(7.3)
Abaterile valorilor reale y
i
, dar necunoscute, faţă de valorile estimate
y
~
(de pe dreapta de regresie) sunt:
i i i i i i
bx a y bx a y y y − − · + − · − ) (
~
(7.4)
Parametrii a şi b se determină din condiţia ca suma abaterilor
pătratice să fie minimă:

·
− − ·
n
i
i i
bx a y R
1
2
) (
(7.5)
Pentru aceasta se derivează expresia (7.5) în raport cu a şi b şi se
egalează cu zero:
0 ) (
0 ) (
1
2
1
2
·
1
]
1

¸

− −


·


·
1
]
1

¸

− −


·




·
·
n
i
i i
n
i
i i
bx a y
b a
R
bx a y
a a
R
(7.6)
Se ajunge astfel la sistemul de ecuaţii:
¹
¹
¹
¹
¹
'
¹
· − −
· − −


·
·
0 ) (
0 ) (
1
1
i
n
i
i i
n
i
i i
x bx a y
bx a y
(7.7)
Din prima ecuaţie se obţine prin substituţie:
∑ ∑ ∑
· · ·
− · − · − ·
n
i
n
i
i
n
i
i i i
x b y x
n
b
y
n
bx y
n
a
1 1 1
1
) (
1
(7.8)
Înlocuind (7.8) în a doua ecuaţie a sistemului (7.7):
∑ ∑
· ·
· − − − · − + −
n
i
i i i
n
i
i i i
x x x b y y x bx x b y y
1 1
0 )] ( ) [( ) (
De unde:
2
1
2
1
1
1
) (
) (
x n x
y x n y x
x x x
x y y
b
n
i
i
n
i
i i
n
i
i i
n
i
i i


·


·




·
·
·
·
(7.9)
Rezultă astfel următoarele expresii ale parametrilor:
190
CALITATEA PRODUSELOR ŞI FIABILITATEA
¹
¹
¹
¹
¹
'
¹


·


− ·




2 2
2 2
x n x
y x n y x
b
x
x n x
y x n y x
y a
i
i i
i
i i
(7.10)
) (
~
2 2
x x
x n x
y x n y x
y bx a y
i
i
i i
i



+ · + ·


(7.11)
Calculele se pot efectua într-o succesiune conform tabelului 7.1. Cu
dreapta de regresie obţinută se poate calcula valoarea variabilei y pornind
de la x.
Estimatorii a şi b sunt fără deplasare, lucru care se poate verifica
uşor. Mai întâi:







·
·


·

− −
·


·
n
i
i i
i
i i
i
i i
i
i i
y c
x x
y x x
x x
y y x x
x n x
y x n y x
b
1
2 2 2 2
) (
) (
) (
) )( (
Structura tabelului pentru regresie. Tabelul 6.1
x
i
y
i
x
2
i
y
i
2
x
i
y
i
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
Σx
i
=… Σy
i
=… Σx
i
2
=… Σy
i
2
=… Σx
i
y
i
=…
M[X]=… M[Y]=…
Mărimile

·


·
n
i
i
i
i
x x
x x
c
1
2
) (
) (
sunt constante deoarece conform schemei teoretice reţinute variabila x
capătă valori cunoscute şi nu aleatoare.
În consecinţă:

·
·
n
i
i i
y c b
1
şi
∑ ∑ ∑ ∑



·


+ · + · + · · · B
x x
x x x
B x c B A c Bx A c y M c y c M b M
i
i i
i i i i i i i i i
2
) (
) (
0 ) ( ] [ ] [ ] [
(7.12)
De asemenea:
] [ ] [ ] [ ] [ b M x y M x b y M a M − · − ·
(7.13)
Înlocuind în relaţia anterioară:
A b M x x B A a M · − + · ] [ ] [
(7.14)
191
Regresie şi corelaţie. Analiza dispersională
Deci estimaţiile sunt absolut corecte.
7.2.2.2. Intervale de încredere pentru parametrii estimaţi
S-a văzut că metoda regresiei nu necesită nici o ipoteză asupra legii
de repartiţie a variabilei aleatoare y. Această variabilă aleatoare are media
teoretică M[y]=A+Bx, iar dispersia constantă pentru toate valorile lui x şi
egală cu σ
2
(valoare în general necunoscută). Dacă repartiţia lui y este
normală şi observaţiile sunt făcute la întâmplare se poate construi un
interval de încredere pentru parametrii dreptei de regresie. Conform celor
prezentate în anexa 7.1. dispersiile parametrilor a şi b sunt date de relaţiile:


·
2
2
2
) ( x x
i
b
σ
σ
(7.15)


+
·
2
2
2
2
) (
1
x x
x
n
i
a
σ
σ
(7.16)
Cu ajutorul estimatorilor punctuali
2
a
σ
şi
2
b
σ
se pot construi intervale
de încredere pentru α şi β conform celor prezentate anterior. Deoarece
2
σ
este în general necunoscut, intervalul se poate determina considerând
dispersia reziduală diferită de abaterile variabilei y în raport cu valorile
dreptei de regresie (valorile estimate)
y
exprimată de relaţia:

·


·
n
i
i
y y
n
s
x
y
1
2 2
)
~
(
2
1
(7.17)
şi care defineşte variabila aleatoare student cu n-2 grade de libertate.
Statistica
2
2
) 2 (
σ
x
v
s n −
are o repartiţie χ
2
conform demonstraţiei
prezentate în anexa 7.2.
Pentru un nivel de semnificaţie α se obţin următoarele intervale de
încredere bilaterale ale valorilor adevărate A şi B:




⋅ t


·

2
2
, 2
2
) ( x x
s
t
x n x
y x n y x
B
i
n
i
i i x
y
α (7.18)


+ ⋅ t − ·
− 2
2
, 2
) (
1
2
x x
x
n
s t x b y A
i
n
x
y α (7.19)
7.2.2.3. Intervalul de încredere a valorii medii
*
y
estimate prin
regresie pentru un x cunoscut
Considerând determinaţi parametrii a şi b ai dreptei de regresie,
pentru o valoare cunoscută (dată)
y x ,
*
va avea în medie valoarea
* *
x b a y + ·
. Variabila aleatoare normală normată
{ }
2 ~
*
/ ]
~
[
~
y
y M y σ −
şi
variabila
2 2
/ ) 2 ( σ
x
y
s n −
cu repartiţii χ
2
, cu n-2 grade de libertate. În acest caz
192
CALITATEA PRODUSELOR ŞI FIABILITATEA
pentru un nivel de semnificaţie α se obţine intervalul de încredere bilateral
a cărui relaţie demonstrată în anexa 7.3 are expresia:



+ ⋅ t · + ·
− 2
2 *
, 2
* * *
) (
) (
1
~
]
~
[
2
x x
x x
s t y Bx A y M
i
n
x
y α (7.20)
7.2.2.4. Estimarea dreptei de regresie care trece prin origine
Se consideră că între media teoretică M[y] şi x există o legătură
exprimată de relaţia:
Bx y M · ] [
(7.21)
Se încearcă o regresie de forma:
bx y ·
~
(7.22)
Parametrul b se determină prin metoda celor mai mici pătrate scriind
suma:
∑ ∑
· ·
− · − ·
n
i
n
i
i i i i
bx y y y R
1 1
2 2
) ( )
~
(
(7.23)
Derivând (7.23) în raport cu b şi anulând expresia rezultă.



·
·
·
·
· − − ·
n
i
i
n
i
i i
n
i
i i i
x
y x
b
x bx y
db
dR
1
2
1
1
0 ) ( 2
(7.24)
193

Sign up to vote on this title
UsefulNot useful