REGRESIA MULTIFACTORIALĂ De cele mai multe ori, descrierea unui fenomen cu ajutorul unei funcţii de o y singură variabilă ( ˆ = f ( x ) ) impune

o prea mare abstractizare, fapt care conduce la pierderi semnificative din esenţa fenomenului. Pentru a se evita astfel de situaţii se apelează la regresia multiplă ( ˆ = f ( x1 , x 2 ,..., x n ) ) . y Regresia multiplă poate fi: - lineară; - nelineară. Introducerea variabilelor cauzale în model trebuie să ţină seama de independenţa variabilelor, respectiv de lipsa autocorelării. Modelul de regresie care exprimă o legătură lineară multiplă este descris de ecuaţia: ˆ Y x1 , x2 ... = a + b1 x 1 + b2 x 2 + ... + bn x n Dacă se aplică metoda celor mai mici pătrate (MCMMP), rezultă: 2 ˆ S = ∑ y −Y = min

(

x1 , x 2 ...

)

şi diferenţiind S în raport cu a, b1, b2… ∂S ∂S ∂S ∂S = 0; =0; =0 … =0 ∂a 0 ∂a 1 ∂a 2 ∂a n Rezultă sistemul de ecuaţii normale: + a1 ∑ x1 + a 2 ∑ x 2 + ... + a n ∑ x n = ∑ y  na 0  2 a0 ∑ x 1 + a 1 ∑ x 1 + a 2 ∑ x 1 x 2 + ... + a n ∑ x 1 x n = ∑ x 1 y  2 + ... + a n ∑ x 2 x n = ∑ x 2 y a0 ∑ x 2 + a 1 ∑ x 1 x 2 + a 2 ∑ x 2  .......  a0 ∑ x n1 + b1 ∑ x n x 1 + b2 ∑ x n x 2 + ... + bn ∑ x n2 = ∑ x n y  Prin rezolvarea sistemului se obţin parametrii a, b1, b2…, bn ai funcţiei. Rezolvarea sistemului poate fi realizată cu Algoritmul SIMPLEX sau rezolvând ecuaţia matriceală: ˆ a = X * X X *Y unde, â= vectorul coloană al parametrilor X= matricea valorilor variabilelor cauzale Y= vectorul coloană de valori empirice ale variabilei rezultative Pentru o funcţie de două variabile, sistemul asociat este:

(

)

−1

Ex: Legătura între valoarea producţiei. β Intensitatea legăturii Coeficientul de corelaţie multiplă Ry/x1/x2 (legătură lineară) 2 2 Ry / x 1 / x 2 = r yx1 + r yx2 − 2 r yx1 ⋅ r yx2 ⋅ rx1 x2 unde. Y=A Kα Lβ În acest caz.+ a1 ∑ x1 + a 2 ∑ x 2 =∑y  na 0  2 a0 ∑ x 1 + a 1 ∑ x 1 + a 2 ∑ x 1 x 2 = ∑ x 1 y  2 = ∑ x2 y a0 ∑ x 2 + a 1 ∑ x 1 x 2 + a 2 ∑ x 2 Regresia multifactorială nelineară Nu de puţine ori regresia multifactorială lineară nu descrie fenomenul corespunzător. r yx1 = [n∑ x n∑ x 1 y − ∑ x 1 ∑ y 2 1 − ( ∑ x1 ) 2 ] ⋅ [ n∑ y 2 − ( ∑ y) 2 ] r yx2 = [ n∑ x [n∑ x n∑ x 2 y − ∑ x 2 ∑ y 2 2 − ( ∑ x2 ) 2 ] ⋅ [n∑ y 2 − ( ∑ y) 2 ] ] rx1 x2 = n∑ x 1 x 2 − ∑ x 1 ∑ x 2 2 1 − ( ∑ x1 ) 2 ] ⋅ [ n∑ x 2 2 − ( ∑ x2 ) 2 Dacă variabilele cauzale sunt idependente între ele 2 ⇒ rx1 x2 = 0 ⇒ R yx1 / x 2 = r 2 2 + r yx2 yx1 . numărul de personal şi volumul mijloacelor fixe este descrisă cel mai bine de funcţia Coob-Douglas. α . pentru a realiza linearizarea se logaritmează: Lgy=lga+α lgK+β lgL Sistemul de ecuaţii devine:  n lg a + α ∑ lg K + β ∑ lg L = ∑ lg y  2  lg a ( ∑ lg K ) + α ( ∑ lg K ) + β ( ∑ lg L )( ∑ lg K ) = ( ∑ lg y )( ∑ lg K )  2  lg a ( ∑ lg L ) + α( ∑ lg K )( ∑ lg L ) + β ( ∑ lg L ) = ( ∑ lg y )( ∑ lg K ) ⇒ lg a .

Un alt mod de determinare a coeficientului de corelaţie multiplă este folosind ∆y metodei determinanţilor R yx1 / x2 = 1 − x ∆y unde ∆y = I r x1 x 2 1 r x 2 x1 I r yx1 1 r x 2 x1 r yx2 r x 2 x1 1 ∑ y − y x1 x 2 ∑ ( y − y) 2 ∆ y x = r x1 y rx 2 y Raportul de corelaţie multiplă R yx1 x2 = 1 − unde 2 S y / x1 x2 2 S y / yx1 x2 S2 y = 1− ( ) 2 = ∑ y i − y x1 x 2 n 2 ( ) 2 ∑ ( y − y) n 2 Coeficientul de determinaţie multiplă D = R yx1 x 2 Coeficientul de nedeterminaţie K=1-D S2 = Corelaţia parţială .

+ a1 ∑ x1 + a 2 ∑ x 2 =∑y  na 0  2 a0 ∑ x 1 + a 1 ∑ x 1 + a 2 ∑ x 1 x 2 = ∑ x 1 y  2 = ∑ x2 y a0 ∑ x 2 + a 1 ∑ x 1 x 2 + a 2 ∑ x 2 Se determină parametrii a 0 . ∑ y ∑x ∑x A = ∑x y ∑x ∑x x ∑x y ∑x x ∑x 1 1 2 1 2 2 1 2 1 2 2 2 = 2 = ∑ y ∑ x12 ∑ x 2 + ∑ x1 y ∑ x1 x 2 ∑ x 2 + ∑ x1 ∑ x1 x 2 ∑ x 2 y − 2 − ∑ x 2 ∑ x12 ∑ x 2 y − ∑ x1 ∑ x1 y ∑ x 2 − ∑ y ∑ x1 x 2 ∑ x1 x 2 n K = ∑ x1 ∑ x2 ∑ x1 2 ∑ x1 ∑ x1 x 2 ∑ x2 ∑ x1 x 2 = ∑ x2 2 2 2 = n∑ x 1 ∑ x 2 + ∑ x 1 ∑ x 1 x 2 ∑ x 2 + ∑ x 1 ∑ x 1 x 2 ∑ x 2 − 2 2 − ∑ x 2 ∑ x 1 ∑ x 2 − ∑ x 1 ∑ x 1 ∑ x 2 − n∑ x 1 x 2 ∑ x 1 x 2 . a1 . a 2 a0 = ∑y ∑x ∑x ∑x y ∑x ∑x x ∑x y ∑x x ∑x n ∑x ∑x ∑x ∑x ∑x x ∑x ∑x x ∑x 1 1 2 1 2 2 1 2 1 2 1 2 1 2 1 2 1 2 2 2 = A K 1 2 2 2 unde.

a1 = n ∑ x1 ∑ x2 n ∑ x1 ∑ x2 n ∑y ∑x y ∑x y ∑x ∑x ∑x x 1 2 1 2 1 1 2 1 1 2 ∑x ∑x x ∑x ∑x ∑x x ∑x 2 2 1 2 2 2 = B K 1 2 2 2 B= ∑x ∑x ∑ y ∑x ∑x y ∑x x ∑x y ∑x 2 2 1 2 2 2 = 2 = n∑ x1 y ∑ x 2 + ∑ x1 ∑ x 2 y ∑ x 2 + ∑ y ∑ x1 x 2 ∑ x 2 − 2 − ∑ x 2 ∑ x1 y ∑ x 2 − ∑ x1 ∑ y ∑ x 2 − n∑ x1 x 2 ∑ x 2 y a2 = n ∑ x1 ∑ x2 n ∑ x1 ∑ x2 ∑x ∑y ∑x ∑x y ∑x x ∑x y ∑x ∑x ∑x ∑x x ∑x x ∑x 1 2 1 1 1 2 1 2 1 2 2 1 2 1 2 1 = C K 1 2 2 2 n C= ∑ x1 ∑ x2 ∑x ∑ y ∑x ∑x y = ∑x x ∑x y 1 1 2 2 = n∑ x12 ∑ x 2 y + ∑ x1 ∑ x1 y ∑ x 2 + ∑ y ∑ x1 x 2 ∑ x1 − − ∑ y ∑ x12 ∑ x 2 − ∑ x1 ∑ x1 ∑ x 2 y − n ∑ x1 x 2 ∑ x1 y .

xk − 1 ( k 2 k −1 )( ) Pentru doi factori ryx1 − ryx2 ⋅ rx1 x2 r yx1⋅ x2 = 2 2 1 − r yx2 1 − rx1 x2 ( )( ) r yx2 ⋅ x1 = ( 1 − r )( 1 − r ) 2 yx1 2 x 2 x1 r yx2 − ryx1 ⋅ rx2 x1 Pentru mai multe variabile independente se vor folosi coeficienţii de corelaţie parţială de ordinul II r y x x − r y x x ⋅ rx 1 x 2 x 3 1 2 3 2 ry x ⋅ x x = 1 2 3 2 1 − r y x x 1 − rx21 x3 x2 ( 3 2 )( ) ry x ry x 2 ⋅ x1 x3 = (1 − ry x r y x − r y x ⋅ rx1 x2 1 r y2x x 3 1 )( 1 − r 2 2 x1 2 x2 x1 x 3 ) ) 3 ⋅ x1 x 2 = (1 − r 3 x1 − ryx 2 y x 2 x1 )( 1 − r ⋅ rx3 x2 x1 2 x3 x 2 x1 .... x − r y x x x . x 1 − rx1 xk . r y x x .... Coeficientului de corelaţie parţială de ordinul I (pentru doi factori de influenţă: factorul a cărei influenţă se măsoară şi factorii reziduali).... xk − 1 1 2 k 2 3 k −1 k −1 r y x x .. x = 1 2 2 k 1 − r y2x x . x ⋅ rx1 xk .Corelaţia parţială măsoară dependenţa dintre variabile prin excluderea succesivă a influenţei celorlalţi factori (considerând influenţa lor constantă) şi măsurând influenţa factorului măsurat...