You are on page 1of 28

LINEARNA

REGRESIONA I KORELACIONA
ANALIZA
Linearna regresiona analiza
 Regresiona analiza se koristi da:
 objasni kakav efekat ima promena nezavisne varijable na
zavisnu varijablu
 predvidi vrednost zavisne varijable na osnovu nezavisne
varijable

 Linearna regresiona analiza:


relacija između nezavisne i zavisne promenljive je izražena
linearnom funkcijom

y = f(x)

 Zavisna promenljiva (y): promenljiva koju želimo da


objasnimo ili predvidimo
 Nezavisna promenljiva (x): promenljiva koju koristimo da
objasnimo zavisnu varijablu
Linearni regresioni model

promena u y
b = nagib

promena u x

a = odsečak

x
Važno!!!
x – nezavisna promenljiva
y = a + bx y – zavisna promenljiva

a – odsečak na y-osi
b – nagib prave
Korelaciona analiza
 Korelaciona analiza se koristi da se izmeri stepen zavisnosti
između dve promenljive (nezavisne i zavisne)

 Stepen zavisnosti se izražava koeficijentom korelacije (r)

 Vrednosti r se kreću od -1 do +1

potpuna potpuna
negativna nema pozitivna
korelacija korelacije korelacija

-1.0 -0.5 0 +0.5 +1.0

povećanje povećanje
stepena stepena
negativne pozitivne
korelacije korelacije
Primeri:

r=1 r = -1
y y

y=a+bx y=a-bx
x x

r = 0,8 r=0
y y

y=a+bx y=a+bx

x x
Linearna regresiona i korelaciona analiza

 Regresiona analiza → jednačina prave (relacija između x i y)


 Korelaciona analiza → r (izražava jačinu odnosa između x i y)

 Primena u farmaciji:
1. izračunavanje jednačine standardne krive
2. procena tačnosti metoda i poređenje metoda
3. procena tačnosti metoda na osnovu metode standardnog
dodatka (“recovery” test)
Standardna kriva
A

promena u apsorbanciji
b = nagib

promena u koncentraciji

a = odsečak
c
A=a+b∙c y = a + bx

x – koncentracija standardnog rastvora (c)


y – apsorbancija (A)
a – odsečak na skali apsorbancije
b – nagib standardne krive
Izračunavanje jednačine standardne krive
Faze:
1. Ispitati koeficijent korelacije

Važno!!!
Stepen zavisnosti između apsorbancije i koncentracije rastvora
mora biti > 0,99

Da li je r > 0,99 ?

2. Ispitati značajnost odsečka a


Zašto se ispituje odsečak a ?

A=a+b∙c y = a + bx
A
A=a+b∙c Ako je c = 0

A=a+b∙
A0= a
a = odsečak
c
Problem!!!
Kada je koncentracija 0
apsorbancija mora biti 0!
Rešenje:
a=0 Hipoteze:
Ho: β0 = 0
HA: β0 ≠ 0
t-test
Primer:

Izračunati jednačinu standardne krive za određivanje koncentracije


magnezijuma, a zatim iz nje preračunati koncentraciju rastvora čija je
A=0,25.

x mmol/L 2,5 5,0 7,5 10,0 12,5 15,0 17,5


y A 0,105 0,202 0,319 0,422 0,515 0,624 0,750

1. Ispitivanje koeficijenta korelacije ( da li je r > 0,99 ?)


  7
 
𝑟=
∑ 𝑥𝑦 − 𝑁 ´𝑥 ´𝑦   70
2 2 2 2
√ ( ∑ 𝑥 − 𝑁 𝑥
´ )( ∑ 𝑦 − 𝑁 ´𝑦 )   10
  875
 
𝑟= ¿ ¿   36,8075
  2,937
  0,419571
0,999368 > 0,99   1,548775
x y xy x2 y2
2,5 0,105 0,2625 6,25 0,011025
5 0,202 1,01 25 0,040804
7,5 0,319 2,3925 56,25 0,101761
10 0,422 4,22 100 0,178084
12,5 0,515 6,4375 156,25 0,265225
15 0,624 9,36 225 0,389376
17,5 0,75 13,125 306,25 0,5625
70 2,937 36,8075 875 1,548775
Ʃ
10 0,41957
2. Ispitivanje značajnosti odsečka a (da li je a = 0 ?)

Hipoteze: 36,8075 − 7 (10 ) ( 0,419 571 )


  ∑ 𝑥𝑦 − 𝑁 ´𝑥 ´𝑦 𝑏=
  = 0,042
Ho: β0 = 0 𝑏= 2 2 2
∑ 𝑥 − 𝑁 ´𝑥 875 − 7 ( 10 )
HA: β0 ≠ 0
t-test 𝑎=
  ´𝑦 −𝑏 ´𝑥 𝑎=0,41957
  1 −0,0425 ( 10 ) =−0,00543

  7
  70 𝑎   −0,00543
𝑡  𝑎= 𝑡 𝑎= =−0 , 718
  10 𝑆𝑎 0,00 756
  875
  36,8075
  2,937
 
∑ 𝑥 2 =0,0 08944
  0,41957
  1,549
𝑆 𝑎 =𝑆 𝑦 , 𝑥
√ 2 2
𝑁 ( ∑ 𝑥 − 𝑁 ´𝑥 )
875
√ 2
7 [ 875− 7 ( 10 ) ]
=0,00 756

2
∑ 𝑦 −𝑎 ∑ 𝑦 −𝑏 ∑ 𝑥𝑦 =
𝑦 ,𝑥 =
√ 𝑁 −2 √ 1,548775+0,00543 ( 2,937 ) −0,0425 ( 36,8075 )
7−2
=0,008944
2. Ispitivanje značajnosti odsečka a (da li je a = 0 ?)
Hipoteze:
𝑡 𝑎=− 0 ,718 Ho: β0 = 0
HA: β0 ≠ 0
𝛼=0,05
  t-test
𝝋=𝑵
  − 𝟐=7 − 2=5 t tabelarno = ± 2,571

N – broj parova x i y
dvostrani test

- 2,571 + 2,571

- 0,718
t a = - 0,718 t tabelarno = ±2,571

t izračunato se nalazi u regionu prihvatanja H0 → Ho se prihvata → Ho: β0 = 0

Zaključak: Testirani odsečak a se statistički ne razlikuje od 0.


3. Jednačina standardne krive

r = 0,99902
Ispunjena su oba uslova za standardnu krivu
a = -0,00543 ≈ 0

Izračunate vrednosti za koeficijente a i b se zamene u opšti oblik linearne


jednačine:
y = a + bx
a = -0,00543
b = 0,0425 y = -0,00543 + 0,0425 ∙ x

Izračunavanje nepoznate koncentracije:


A 0,8
0,7 y = -0,00543 + 0,0425 ∙ x
0,6 y = -0,00543 + 0,0425 ∙ x
0,5
0,4 x = (y + 0,00543) / 0,0425
0,3
0,2 Za A=0,25:
0,1
0 x = (0,25 + 0,00543) / 0,0425
-0,1 0 5 10 15 20 x = 6,01 mmol/L
c (mmol/L)
Poređenje dve metode

 Kada želimo da jednu metodu zamenimo drugom, obavezno se


prethodno mora proveriti kakvo je slaganje rezultata koji se
dobijaju ovim metodama.

 Postupak:
- metodom 1 se odredi koncentracija u seriji standarda
- metodom 2 se odredi koncentracija u istoj seriji standarda
- dobijeni rezultati se predstave u koordinatnom sistemu
Izračunavanje

Faze:
1. Ispitati koeficijent korelacije

Važno!!!
Stepen slaganja između rezultata dve metode mora biti > 0,90

Da li je r > 0,90 ?

2. Ispitati konstantnu sistematsku grešku (značajnost odsečka a)

3. Ispitati procentualnu sistematsku grešku (značajnost nagiba b)


Zašto se ispituje odsečak a ?
5
Odnos između rezultata metoda 1 i 2

metoda 2
opisuje linearna jednačina: 4

3
y = a + bx
2
x – rezultati metode 1
y – rezultati metode 2 1
odsečak a
0

0 1 2 3 4
metoda 1
Ako je a ≠ 0 (npr. a = 1) tada jednačina postaje: y = 1 + bx

Primer: Ako smo metodom 1 izmerili koncentraciju 1 mol/L, tada će metodom 2


biti izmereno y = 1 + b ∙ 1.
Ako smo metodom 1 izmerili koncentraciju 2 mol/L, tada će metodom 2
biti izmereno y = 1 + b ∙ 2.

Zaključak: metoda 2 daje za 1 mol/L veće rezultate od metode 1.

Kada je a ≠ 0 postoji konstantna sistematska greška metode 2 u odnosu na


metodu 1!!!
Zašto se ispituje nagib b?
4
Odnos između rezultata metoda 1 i 2

metoda 2
3,5
opisuje linearna jednačina: 3 b=1
2,5
y = a + bx 2
1,5
x – rezultati metode 1 1 b=0,5
y – rezultati metode 2 0,5
0
0 1 2 3 4

Ako je b ≠ 1 (npr. b = 0,5) tada jednačina postaje: y = 0,5 ∙ x metoda 1


(uzeto je da nema sistematske greške, a = 0)

Primer: Ako smo metodom 1 izmerili koncentraciju 1 mol/L, tada će metodom 2


biti izmereno y = 0,5 ∙ 1.
Ako smo metodom 1 izmerili koncentraciju 2 mol/L, tada će metodom 2
biti izmereno y = 0,5 ∙ 2.

Zaključak: metoda 2 daje 2 puta manje rezultate od metode 1.


(50% manje)

Kada je b ≠ 1 postoji procentualna sistematska greška metode 2 u odnosu


na metodu 1!!!
Primer:
Iz različitih uzoraka jedne lekovite biljke ekstrahovana je aktivna
supstanca procesima vodene ekstrakcije i alkoholne ekstrakcije.
Pokazati da li se sadržaj ekstrahovane aktivne supstance razlikuje u
zavisnosti od postupka ekstrakcije.

Vodena ekstrskcija 52 108 156 202 248 306 356 401


(metoda 1)
Alkoholna ekstrakcija 54 110 158 208 252 308 359 406
(metoda 2)

  8
1. Ispitivanje koeficijenta korelacije ( da li je r > 0,9 ?)
  1829
 
𝑟=
∑ 𝑥𝑦 − 𝑁 ´𝑥 ´𝑦  ´𝑥 =228,625
√ ( ∑ 𝑥
2
− 𝑁 𝑥
´
2
)( ∑ 𝑦
2
− 𝑁 𝑦
´
2
)   522185
  528706

𝑟= ¿ ¿   1855
  231,875
0,9999 > 0,90   535329
2. Ispitivanje postojanja konstantne sistematske greške (da li je a ≠ 0 ?)

Hipoteze: 528706 − 8 ( 228,625 ) ( 231,875 )


  ∑ 𝑥𝑦 − 𝑁 ´𝑥 ´𝑦  
𝑏= =1,0055 4408
Ho: β0 = 0 𝑏= 2
∑ 𝑥 2 − 𝑁 ´𝑥 2 522185 −8 ( 228,625 )
HA: β0 ≠ 0
t-test 𝑎=
  ´𝑦 −𝑏 ´𝑥 𝑎=231,875
  −1,0055 4408 ( 228,625 )=1,9 8248

  8
  1829 𝑎 1,9 8248
  228,625
𝑡  𝑎=
𝑆𝑎
𝑡  𝑎= =1 , 621
1 ,22297
  522185
  528706
  1855   2
∑𝑥

 
  231,875
  535329 𝑎
𝑆 =𝑆 𝑦 , 𝑥

2
√ 2
𝑁 (∑ 𝑥 − 𝑁 ´𝑥 )
2
=1,543937
√[ 522185
2
8 522185−8 ( 228,625 ) ]
=1,22297

∑ 𝑦 −𝑎 ∑ 𝑦 −𝑏 ∑ 𝑥𝑦 535329−1,982484 ( 1855 ) −1,0055 4408 (528706 )


𝑆 𝑦 ,𝑥 =
√ 𝑁 −2
=
√ 8−2
=1,543937
2. Ispitivanje postojanja konstantne sistematske greške (da li je a ≠ 0 ?)

𝑡  𝑎=1 , 621 Hipoteze:


Ho: β0 = 0
𝛼=0,05
 
HA: β0 ≠ 0
𝝋=𝑵
  − 𝟐=8 − 2=6 t = ± 2,447
tabelarno
t-test
N – broj parova x i y
dvostrani test

t a = 1,621 t tabelarno = ± 2,447

t izračunato se nalazi u regionu prihvatanja H0 → Ho se prihvata → Ho: β0 = 0

Zaključak:
Metoda 2 (alkoholna ekstrakcija) ne pokazuje konstantnu sistematsku grešku u
odnosu na metodu 1 (vodenu ekstrakciju).
2. Ispitivanje postojanja procentualne sistematske greške (da li je b ≠ 1 ?)

Hipoteze:   ∑ 𝑥𝑦 − 𝑁 ´𝑥 ´𝑦   528706 − 8 ( 228,625 ) ( 231,875 )


𝑏= 𝑏= =1,0055 4408
Ho: β1 = 1 ∑ 𝑥 2 − 𝑁 ´𝑥 2 522185 −8 ( 228,625 )
2

HA: β1 ≠ 1
t-test 𝑎=
  ´𝑦 −𝑏 ´𝑥 𝑎=231,875
  −1,0055 4408 ( 228,625 )=1,9 8248

  8
  1829 1,0055 4408 −1
 
𝑡 𝑏=
𝑏 −1 𝑡 𝑏= =1 , 158
  228,625 𝑆𝑏 0,00 4787
  522185
  528706
  1855
  231,875
  𝑆𝑦,𝑥 1 ,543937
  535329 𝑆𝑏= = =0,00 4787
2 2 2
√∑ 𝑥 − 𝑁 ´𝑥 √522185 −8 ( 228,625 )
  2
∑ 𝑦 −𝑎 ∑ 𝑦 −𝑏 ∑ 𝑥𝑦 535329−1,982484 ( 1855 ) −1,0055 4408 (528706 )
𝑆 𝑦 ,𝑥 =
√ 𝑁 −2
=
√ 8−2
=1,543937
2. Ispitivanje postojanja procentualne sistematske greške (da li je b ≠ 1 ?)

𝑡  𝑏=1 , 158 Hipoteze:


Ho: β1 = 1
𝛼=0,05
 
HA: β1 ≠ 1
𝝋=𝑵
  − 𝟐=8 − 2=6 t = ± 2,447
tabelarno
t-test
N – broj parova x i y
dvostrani test

t b = 1,158 t tabelarno = ± 2,447

t izračunato se nalazi u regionu prihvatanja H0 → Ho se prihvata → Ho: β1 = 1

Zaključak:
Metoda 2 (alkoholna ekstrakcija) ne pokazuje procentualnu sistematsku
grešku u odnosu na metodu 1 (vodenu ekstrakciju).
Poređenje dve metode

 Zaključak:

Pošto alkoholna ekstrakcija ne pokazuje ni konstantnu


sistematsku ni procentualnu sistematsku grešku u odnosu na
vodenu ekstrakciju, nema razlike u rezultatima koje daju ove
dve metode (postupka ekstrakcije).
ZADACI ZA VEŽBANJE
Zadatak 1.
Uzorci jednog leka skladišteni su u svojim originalnim pakovanjima pri
normalnim uslovima čuvanja i periodično je analiziran sadržaj aktivne
supstance u tim preparatima (dobijene vrednosti su prikazane u tabeli).
Ako dobijeni podaci prate normalnu raspodelu, koliki sadržaj aktivne
supstance možemo da očekujemo nakon 20 meseci?

Mesec 6 12 18 24 36 48
Sadržaj 995 984 973 960 952 948
(mg)
  6
  144
  24
  4680
  138108
  5812
  968,6667
  5631618
  ∑ 𝑥𝑦 − 𝑁 ´𝑥 ´𝑦 138108− 6 ( 24 )( 968,6667 )
𝑏= 2 2
= 2
=−1,13
∑𝑥 −𝑁 𝑥 ´ 4 680 −6 ( 24 )

𝑎=
  ´𝑦 −𝑏 ´𝑥 =968,6667 +1,13 ( 24 ) =995,79

y = a + bx y = 995,79 – 1,13x

x = 20 y=?
y = 769,79 mg

Zaključak: Sadržaj aktivne supstance koji može da se očekuje nakon 20 meseci


iznosi 769,79 mg.

Šta kad je x = 60?

y=? Vrednost x izlazi iz opsega jednačine prave i tada


y = 927,99 jednačina nije pouzdana za predviđanje vrednosti y
Zadatak 2.
Kod 20 trudnica određivana je nefelometrijskom metodom
koncentracija alfa-1-antitripsina u određenim mesecima trudnoće
(vrednosti su date u g/L). Ako su podaci normalno distribuirani,
koja koncentracija alfa-1-antitripsina može da se očekuje u 6.
mesecu trudnoće?

Mesec 1 3 5 7 9
α-1-AT 3,06 3,68 3,66 3,91 3,85

  5   ∑ 𝑥𝑦 − 𝑁 ´𝑥 ´𝑦 94,42 −5 ( 5 ) (3,632 )
𝑏= = =0 , 0905
  25 2
∑ 𝑥 − 𝑁 ´𝑥 2
165 −5 ( 5 )
2

  5
  165 𝑎=
  ´𝑦 −𝑏 ´𝑥 =3,632 −0 , 0905 ( 5 ) =3,18
  94,42 y = 3,18 + 0,0905x
y = a + bx
  18,16
  3,632 x=6 y=?
y = 3,72
  66,4122
Zaključak: Tokom 6-og meseca može da se očekuje
koncentracija alfa-1-antitripsina od 3,72 g/L.

You might also like