Latvijas Universitātes Ķīmijas fakultātes doktorantūras studijas studentes Kristīnes Krūkles-Bērziņas

2. mājas darbs

Lineārā daudzfaktoru regresija un korelācija
Teorētiskā daļa
VIENKĀRŠĀ LINEĀRĀ REGRESIJA Pilnīgi lineārām jeb funkcionālām sakarībām ir raksturīgs, ka katrai x vērtībai atbilst viena noteikta y vērtība, tātad attiecības ir pilnībā prognozējamas. Piemēram, Oma likums elektriskās ķēdes posmā nosaka, ka sprieguma kritums U ir tieši proporcionāls strāvas stiprumam I un ķēdes posma pretestībai R. Oma likuma formula ir U = IR. Zinot ķēdes pretestību un strāvas stiprumu ķēdē, varam droši paredzēt (aprēķināt, prognozēt) sprieguma kritumu šajā ķēdes posmā. Vispārīgā gadījumā lineāru sakarību var aprakstīt ar vienādojumu y = ax + b, kur a ir taisnes virziena koeficients a=tgα= Δy/Δx un brīvais loceklis b (y=b, ja x=0), piemērs ir attēlots 1. attēlā.

1. att. Vispārīga lineāra sakarība DAUDZFAKTORU REGRESIJA UN KORELĀCIJA
Ja ir nepieciešams pētīt lineāru sakarību starp vairāk nekā divām pazīmēm, kur viens mainīgais ir atkarīgais un pārējie ir neatkarīgie mainīgie, tad var veikt daudzfaktoru regresiju analīzi jeb multiplo regresijas analīzi. Sakarību izteikšanai lieto daudzfaktoru korelāciju – regresijas vienādojumu jeb modeli. To vispārīgā veidā var uzrakstīt kā vairāku argumentu statistisku funkciju: ̃ =ƒ(x1, x2,....xn), (1) 1

. ∑ .kur ̃ – atkarīgais (rezultatīvais) mainīgais lielums. b1. x2... bm atbilstošos parciālos atvasinājumus... b2.. . Šos skaitļus sauc par krossummām. ̃ .. bn}=A-1B.rezultatīvās pazīmes pēc regresijas vienādojuma aprēķinātā vērtība i-tajam novērojumam (kopas vienībai).. b1. bo. Tagad šos skaitļus aprēķina ar datora palīdzību. x0.∑ . b1.. atrisinājumu var pierakstīt šādi: X{bo. b2. Tiek izvirzīta prasība: ∑ ̃ (3) kur Qz ir atlikusī jeb neizskaidrotā noviržu kvadrātu summa... ņemot visiem parametriem... pielīdzinot tos nullēm un apvienojot sistēmā.i-rezultatīvās pazīmes faktiskā vērtība i-tajā novērojumā.. Lietojot šo paņēmienu.. Vienādojumā (3) ̃ vietā ievietojot vienādojuma (2) labo pusi. pēc tās vienkāršošanas iegūst normālvienādojumu sistēmu daudzfaktoru regresijas vienādojumu parametrus b o. b2. ko aprēķina pēc konkrēta novērojuma vai eksperimenta datiem.. parasti aprēķina ar vismazāko kvadrātisko metodi... bn ir vienādojuma parametri. izmantojot inversās matricas paņēmienu. Daudzfaktoru regresijas vienādojuma parametrus bo. (2) kur b1.. b2. { {{ { ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ (4) { ∑ ∑ ∑ ∑ ∑ Lai pāriet no normālvienādojumu sistēmas vispārīgā pierakstā uz konkrētu uzdevumu.... bm aprēķināšanai..... ∑ jāaizstāj ar skaitļiem.. b2.. lielumi bo.. Lineārā formā daudzfaktoru korelācijas – regresijas vienādojumu var rakstīt šādi: ̃=bo+b1x1+b2x2+. (5) ∑ ∑ (∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ 2 ∑ ∑ ∑ ∑ ) ∑ ∑ ∑ (∑ ) kur . xn – neatkarīgie (faktoriālie) mainīgie lielumi. b1.novērojumu (kopas vienību) skaits.+bmxm. bm tā pat kā vienkāršās regresijas vienādojuma parametrus. x1. n. ..

un pēc tiem nevar pateikt. jo bo=0 (6). ir visu mainīgo lielumu standartizēšana.Rezultatīvās un visas faktoriālās pazīmes izsakot novirzēs no aritmētiski vidējiem. tāpēc vienādojuma (2) var aprēķināt vienādojumu ( ̃ . Viens no paņēmieniem. cietās vielas daudzums. Aktivācijas enerģija var būt atkarīga no dažādiem faktoriem kā relatīvais gaisa mitrums. jo lielāka enerģija. reizinot koeficientu matricas inverso ar rezultējošo matricu. tad lieto (7) vienādojumu: (7) kur sj – attiecīgās faktoriālās pazīmes. daudzfaktoru regresijas vienādojumu koeficenti nemainās. kā padarīt salīdzināmus dažādu faktoru ietekmes rādītājus. kurš faktors rezultatīvo pazīmi ietekmē vairāk un kurš mazāk. bet s0 – rezultatīvās pazīmes standartnovirzes. viena regresijas vienādojuma koeficenti nav savstarpēji salīdzināmi. Lai atrisinātu (6) vienādojuma koeficentu nepieciešams atrisināt un sastādīt šādu normālvienādojuma sistēmu: { ∑ ∑ ∑ ∑ ∑ ∑ Sistēmas atrisinājums tiek iegūts. ka visi mainīgie tiek izteikti standartnovirzēs no aritmētiski vidējā: (6) Ja ir aprēķināti parastie regresijas koeficenti un no tiem jāpāriet uz koeficentiem standartizētā mērogā. Lai iegūtu regresijas vienādojumu sākotnējās mērvienības. Lai regresijas koeficents varētu izmantot šādiem nolūkiem. Tas nozīmē. tie ir jāpārveido. jo reakcija notiek lēnāk un otrādi. daļiņas lielums un citiem faktoriem. Uzdevums ir pārbaudīt vai pastāv daudzfaktoru lineāra regresija starp relatīvo gaisa mitrumu un aktivācijas enerģiju un parauga daudzuma un aktivācijas enerģiju! Relatīvais gaisa 3 . papildus jāaprēķina vienādojuma brīvais loceklis: (8) Ja faktori ir dažādi vai dažādas to mērvienības. Eksperimentālā daļa Cietfāžu pāreju raksturo aktivācijas enerģija.

2. Rezultātā iegūst sistēmu: 4 .7 9232. ∑ x12 196 576 1156 1936 2916 4096 6780 x22 174.08 360. tabulā.2345 15. 4.3 1746.60 1391. tabula Eksperimentālie dati Nr.1 2043.9983 15.p. 2.k.31 290.3189 17.0316 18. 4. kuru vispārīgs attēlojums ir parādīts (4) vienādojumā.p. 1. 1. xvid ∑ Relatīvais gaisa mitrums.94 1538.3 x1x0 378 1392 3026 4708 6480 9664 25648 (xo-x0vid)2 4225 1156 9 225 784 3481 9880 1.032 919.628 531.8 2868. 5.mitrums un parauga daudzums ir viens no otra neatkarīga parametri.706 1215. 2.4285 Aktivācijas enerģija kJ/mol (x0) 27 58 89 107 120 151 92 552 Sākumā 1. 3.89 x02 729 3364 7921 11449 14400 22801 60664 x1x2 184.9048 95. tabulas krossummas ievieto divfaktoru normālvienādojumu sistēmā.62 244.491 718.2131 14.36 266. tabula datiem aprēķina krossummas. 1.75 825. 3. ko attēlo 2.59 202. g (x2) 13. 6.73 x0x2 356. tabula Eksperimentālo datu krossummas Nr.6321 16.k. tabulā. % (x1) 14 24 34 44 54 64 39 234 Parauga daudzums. un 2. 6.983 341. Eksperimentālie dati apkopoti 1.89 3911. 5.

k.363 2.790 0.79 0. Visvieglāk to izdarīt Excel programmā ar funkciju Minverse.00 420.172 1.8280 6. tabula Eksperimentālo datu noviržu summas Nr. 5.90 77.34 190.8 ∑(x2-x2vid) (x1.0 56. 3. 1.x2vid) 175.245 2. tabulas datiem aprēķina aritmētiski vidējās vērtības.{ Iegūto sistēmu nepieciešams parakstīt matricas formātā: ( Koeficentu matrica )( ) Rezultējošā matrica Koeficentu matricai nepieciešams atrast inverso matricu. Koeficentu inversā matrica: ( ) Tālā iegūto koeficentu inverso matricu jāreizina ar rezultējošo matricu.212 31. 2.071 16. ∑ ∑(x1. No 1.5 452. 3.x1vid) 67.x1vid)2 625 225 25 25 225 625 1750 ∑(x2.12 ∑(x0-x0vid) (x1. Visvieglāk to izdarīt Excel programmā ar funkciju MMULT.05 1.x1vid) 1625 510. 6. 4. { Iegūtais regresijas vienādojums: ̃ Regresijas koeficentu var aprēķināt pēc noviržu summas metodes.0 5 .29 25.00 75.p.074 0. tabulā.570 21. ko attēlo 3.55 182.0 1475 4120 ∑(x0-x0vid) (x2.x2vid)2 7.0 15.270 9.

6 .14.3 Pēc (8) vienādojumu iegūst b0=-131. Izmanoties parauga masai par 1 standartnovirzi aktivācija enerģija pieaugs par 0.85% no aktivācijas enerģijas izmaiņām. √ ∑ √ Regresijas vienādojums standartizētā mērogā: ̃ No standartizētiem koeficentiem var redzēt. Var redzēt. ka iegūtie koeficenti sakrīt ar pirmo metodi iegūtajam vērtībām. iegūstot determinācijas koeficientu jeb korelācijas koeficientu kvadrātā: No iegūtā rezultāta var redzēt. s1 un s2). apskatot.Nepieciešams sastādīt noviržu summu sistēmu pēc (7) vienādojuma: { Sistēmu atrisina reizinot koeficientu matricas inverso ar rezultējošo matricu. Nepieciešams aprēķināt standartnovirzes (s0. izskaidro vienādojumā ietvertie faktori – relatīvā gaisa mitrums un parauga masa. jo koeficents ir lielāks par relatīvā gaisa mitruma koeficentu. Šādam nolūkam aprēķinam dispersiju un atkarīgā faktora so (kas jau ir aprēķināts): ∑ ̃ Tad iegūto dispersiju izdala ar standartnovirzi. Var veikt korelācijas analīzi. tad tie savā starpā nav salīdzināmi un nepieciešams standartizēt vienādojumu. cik labi iegūtais modelis apraksta eksperimentālos datus.522 standartnovirzēm. Šajā gadījumā to visvieglāk darīt pēc (7) vienādojuma.13 un b2=11. Tā kā ietekmējošo faktori nav vienādi (nav vienādas to mērvienības). ka 98. ka pārejas aktivācijas enerģiju ietekmē vairāk. parauga masa. Iegūst: b1=1.

28 9.00132 Regression Residual Total Coefficients Intercept -131.3014 Lower 95% -466 Upper 95% 204 Lower Upper 95. kā arī pārbadīt vai aprēķinātie koeficenti ir sakrītoši.1 X Variable 1 1.980 Standard Error 6.0% -466 204 0.249 0.02 4.54 F 123.6 9880 MS 4880 39.9 7 .3355 -2.9 -17.3 t Stat -1.3001 -17.28 -2.990 Adjusted R Square 0.994 R Square 0.245 P-value 0.4 Significance F 0.4 39. Iegūtie dati attēloti zemāk: Regression Statistics Multiple R 0.132 X Variable 2 11.0% 95.144 0.Regresijas koeficentu atrašanu var veikt arī Excel vidē izmantojot Data Analysis Anova funkciju.25 Standard Error 105.4 39.02 4.9895 1.007 1.29 Observations 6 ANOVA df 2 3 5 SS 9761 118.