You are on page 1of 12
26 ‘Mavonitiquas It Full 6a Regwssi6 Inet simple Slucions Matematiques II. Full 6a. Regressié lineal simple. Solucions (1) Tenim informacié sobre la llargadia i ’'amplada dels paladars de 47 cangurs grisos occidentals (Macropus fuliginosus), i creiem que I'amplada depén linealment de la llargada. Per estudiar aquesta dependéncia, volem calcular la recta de regressié lineal per minims quadrats de 'amplada en funcié de la llargada i, com que som uns saaics, en lloc a’emprar la funcié adient de R, volem que ho feu ama. A partir de les nostres dades (33, Y))iet,...47 (0N les x; representen les llargades de! paladar dels nostres exemplars i les yj, les amplades, totes dues donades en centéssimes de milimetre) hem calculat els valors segients: ## (1) 1036.15 ## [1] 259.66 ## (1) 1363.61 ## [1] 990.36 ## (1) 2996.03 Posaré noms als valors, per poder emprar-los en calculs “ound (wean ( =) ,2) “ound (wean (y 3) 3) 52.y=round(var(y),3) v3) round (var round (cov (a) Calculau la recta de regressié corresponent. Com que els valors de x i y sin nombres enters de tenen 3-4 xxitfes, donau (j emprau a partir d’ara) el valor del terme independent arrodonit a 1 xifra decimal jel de la pendent arrodonit a § xifres decimals. bl=round(s-=y/s2-2,5) bO=round(y-b-bl*=.b,1) (60,61) ## [1] 32.30000 0.21943 Obtenim la recta Y = 32.3 + 0.21943X. (b) Calculau el coeficient de determinacié R?.Donau el resultat arrodonit a 4 xifres decimals. Interpretau el resultat, de dues maneres: qué significa el resultat (significa) i qué implica (implica) el resultat sobre la bondlat de ('alust dels punts (largada,amplada) a la recta obtinguda. Ross. xy*2/(s2.x*s2.y) round(R2,4) sess baw/Donlond felis bod us 212020 ‘Mawoniniques II Ful6a Repiesié neal simple Sclucons ## [1] 0.6538 Aix significa que la variancia dels valors estimats de les amplades del paladar als cangurs de la mostra és un 66.98% de la variancia dels valors reals de les amplades del seus paladars. No és per fer grans escarafalls, perd l'ajust des punts a la recta de regressié deu ser bastant bona. De fet, és plot(=,y/eck abline( L(y 200 220 240 260 280 300 320 900 1000 1100 1200 (¢) Calculau el valor de S, estimacié de la desviacis tipica de totes les variables error (a partir de la definicié de R? j de la identitat de les sumes de quadrats, heu de poder trobar-la). Donau el valor arrodonit a 4 xifres decimals. Sabem que S? = SSg/(n — 2) ique R? = 1 — SSp/SSporai 1 WE Stora = N57 = (n— 1)52. Per tant SSp = SSrowi(1 = R) = (n= 51 = R) Dona nelenath 85 .B=(n-1)*s2.y#(1-R2) 88.5 ## (1) 15315.1 Finalment: sess baw/Donlond felis bod us 2162020 ‘Mavonitiquas Il Full 6a Regwssi6 Ine simple Solucions Seround (sqrt (S2),4) 5 ## [1) 18.4482 (@) Trobau un interval de confianca al 95% per al pendent de la recta de regressié. Donau els extrems arrodonits a5 xifres decimals. Amb aquest nivell de confianca, podeu rebutlar que sigui 0? Aplicant la fSrmuta IC .bl=bl+gt(0.975,n-2)*6/aqrt/ ((n-1)/n)*s2.x*n)*e(-1,1) round(IC.b1,5) ## [1] 0.17285 0.26631 Tenim un 95% de confianga que f; € [0.17255, 0.26631]. Com que aquest interval de confianga no conté €1 0, amb aquest nivell de confianga concloem que f, # 0 (¢) Trobau un interval de confianca al 95% per a ’amplada esperada de! paladar quan la seva llargada és 1000. Donau els extrems arrodonits a enters. IC .y0=y0 .captgt( 0.975,n-2)*Sksqrt(1/n+{x0-z-b)*2/((n-1) #82 round( Ic .y0) )¥e(-1,1) ## [1] 246 257 Tenim un 95% de confianga que 'amplada esperada del paladar d'un cangur gris occidental la llargacla del paladar del qual és 1000 esta entre 246 i 257. Fem ara els calculs amb les dades originals: + Larecta de regressié round ( Ln(y-=]5coefficients,5) ## (Intercept) = #4 32.29598 0.21943 + ER summary ( lm(y-x) )§x-squared ## [1] 0.6638224 + Las summary (lm(y-x) )§sigua sess baw/Donlond felis bod 38 2162020 ‘Mavonitiquas Il Full 6a Regwssi6 Ine simple Solucions ## [1] 18.44818 + LIC 95% pera By round (confint(lm(y-=)),5){2r] a 258 9758 ## 0.17255 0.26632 * LIC 95% per a 'amplada esperada del paladar ata.fran 000) yeangur,interva: cangur: Any: round (predict .1m ‘confidence #8 fit lve upe #81 252 246 257 (2) En un estudi es mesura, per a 20 vies piibliques amb carril bici, la distancia de la linia central de la calcada al costat més proper a la caleada del carl bici, i després, per mitja de fotografies, a cada un la distancia en un cas concret entre un ciclista circulant pel carn bici iun cotxe circulant pel seu costat de la calcada. Les dades (en metres) sén: Dist .centre=c( 3.84,3.90,3.93,3.93,4 .05,4.15,4 42,4 .45,4 51,4 60,4 .88,5,06,5.18,5.33, 5 .46,5.46,5.64,5.94,6.19,6.34) Dist .cotze=c(1.53,1.68,1-89,1.92,1.98,2.13,2.38,2-83,2.29,2-16,2-90,2-32,2-35,3-05,2. 35,2.53,3.29,3.29,2.62,3.35) Sia exercici anterior tots els calculs els havieu de fer heu d’emprar les funcions de R adequades aplicades a aquests dos vectors per efectuar tots els calculs. ma” perqué no hi havia més remei, en aquest exercici (a) Calculau la recta de regressié per minims quadrats de la distancia del cotxe al ciclista en funcid de la distancia de fa linia central de la calcada al cami bici. Donau els coeficients arrodonits a & xifres decimals. round ( Lin( Diat .Cotze-Dist .Centre)§cosfficients,3) ## (Intercept) Dist centre “oe 0.267 0.554 (0) Dibuixau un grafic amb els punts de la mostra i a recta de regressié lineal. plot (Dist centre, Dist .cotze, eck abline( Ln( Dist .co 0) .-Dist .Centre) ,co! red") sess baw/Donlond felis bod 2162020 ‘Mawonitiquas It Ful 6a Regwessi6 linea simple Solucions Dist.Cotxe 4.0 45 5.0 5.5, 6.0 Dist.Centre (¢) Calculau el coeficient de determinacié d’aquesta regressié. Donau el resultat arrodonit a 4 xifres decimals. La seva bondat, 0 no, queda reflectida en el grafic anterior? “Dist Centre) )§r-squared A ) round ( sunmary ( lmn( Dist .Cot ## [1] 0.7048 (2) Contrastau si els errors s‘alusten a la distribucié normal N(0, S), on S és 'estimacié de la desviacié tipica compartida per totes les variables error. -Dist Centre) )$signa,5) Seround (summary ( ln( Dist .Cot 5 ## (1) 0.29548 Brrors=sumary lm( Dist .Cotze-Dist Centre) )$residuals ks.test(Brrors, "pnomn",0,5) “oe ## One-sanple Kelmogorov-Smirnov test “oe ## data: Errors ## D = 0.11495, p-value = 0.9272 ## alternative hypothesis: two-sided No podem rebutjar que els errors segueixin una llei normal (0, S) sess baw/Donlond felis bod 518 2162020 ‘Mavonitiquas It Full 6a Regwssi6 Inet simple Slucions (¢) Calculau intervals de confianca del 95% per als coeficients de la recta de regressié confint(1m(Dist Cotze-Dist .centre)) “oe 258 97.58 ## (Intercept) -1.1420541 0.6072028 ## Dist.Centre 0.3764924 0.7316407 (f) A quina distancia estimau que avancaria un cotxe a un ciclista en una via on la distancia de a linia central al cartil bici és de 6 m? Cassdata-frame( Dist centr: predict .1m(Ln( Dist .cot ) y-Dist Centre) ,Cas) “oe 1 ## 2.502907 “(g) Calculau un interval de confianga del 95% per a la distancia mitjana a la que avangaria un cotxe a un ciclista en una via on la distangia de a linia central al carril bici és de 5 m.* predict .Im( Ln( Dist .Cotze-Dist .Centre) ,Caa,interval="confidence") “oe fit we ver ## 1 2.502907 2.36198 2.643834 sess baw/Donlond felis bod 61s 26 ‘Mawnitiqus It Full 6h Reprssi lineal multiple Matematiques II. Full 6b. Regressié lineal multiple. (1) He pres una mostra aleatéria de 15 estudiants de BLM del curs 2018/19 que es presentaren a ’examen final de Matematiques I! he anotat algunes de les notes que varen obtenir (totes sobre 100 excepte la d’Extres}) Control, Casa (nota mitjana dels exercicis de casa), Tallers (nota mitjana dels tallers), Tests (nota mitjana dels tests), Extres (dacimes extra, sobre 10), Final (nota de 'examen final), Socrative (nota global dels tests de Socrative), Q_Final (nota de l’apartat de questions de 'examen final). Teniu aquestes dades a la taula de dades ttps://raw.githubusercontent.com/AprendeR-UIB/MatesilAD/master/dades/mostranotes19.csv (https://raw. githubusercontent.com/Aprende R-UIB/MatesliAD/master/dades/mostranotes19.csv). Carregau-la en un data frame. Dadet read .cev( "https: //raw.githubusercontent .can/AprendeR-UIB/MatesTIAD/master/dade s/mostranctes]9.cav") str(Dades) #4 ‘data.frane! 15 obs. of @ variables: ## § Control + int 49 51 67 44 55 63 45 40 63 54 ## 5 Casa int 68 72 45 70 52 65 38 32 78 46. ## 5 Tallers 35.7 71.7 45.7 43.7 36.7 50.7 28.7 13.3 66.3 48.7 ## 5 Tests 36 84 57 74 72 78 50 227250. ## 5 Final 50.3 50 35.3 30 34.8 37 7 15 42.8 33 ## 5 Bxtres TA 9.95 9.57.9 7.95.5 6.27.4 84 #4 5 Q Final 017.3 32.3120 ## © § Socrative 61.5 89 14 84 71.5 60 4.5 38.5 52 82.5 (@) Calculau la funcié de regressis lineal de la nota de I'examen final respecte de les notes Control, Casa, Tallers, Tests, Extres i Socrative. An €inal-Control+Casn+fallers+Pesteti reatSocrative, data=Dades )§coefficients ## (Intercept) Control Casa Tallers Teats res ## -38.03955565 0.50401587 0.27623522 0.27200352 -0.1739864 444277957 #4 Socrative #8 -0.07434045 (0) Qué valen el seu coeficient de determinacié multiple i el seu coeficient de determinacié ajustat? summary ( lm( Final-Control+Casatfallers+Teats+Eztreatsocrative, dat: fades) )§r.squared ## [1] 0.7511543 summary ( lm( Final-Control+Casatfallers+Teate+Eztrestsocrative, dat: ed ## [1] 0.5645201 (¢) Calculau la funcié de regressié lineal de la nota de I'examen final respecte de les notes Control, Tallers i Extres. se rdaetiatia/Dowalondflo bs (1) hoa) 6 2162020 ‘Mawnitiqus It Fall 6h Reprssi linea multiple An(€inal-Control+fallers+Eztres, dat! ades )$coef ficients ## (Intercept) Control_—Tallers Bxtres ## -36.1255511 0.5609372 02250313 40417432 (@) Qué valen el seu coeficient de determinacié milttiple i el seu coeficient de determinacié ajustat? summary ( li Final-Control+Pallers+Bztres,data-Dades) )$x-aquared ## [1] 0.7100466 summary ( lm( Final-Control+Pallers+Bztres, dat ## [1] 0.6309684 (¢) Quina és millor? La de variables independents (f) Quina de les dues regressions déna una suma de quadrats dels errors més petita? Rag .Tot=Im( Final-Control+Casatfallers+Teats+Eztreatsocrative, dat: Rag .3=Ln( Final-Control+fallere+Eztres,data=Dades) sum( Reg. Tot§residuals*2) ## [1] 608.4509 sum(Reg.35residuals*2) ## {1} 708.9631 (g) Quina és Vestimacié S de la desviacis tipica comuna de les variables error a la regressié de (a)? I a la de (c)? summary (Reg. Tot )§sigua ## [1] 8.72103 summary (Reg.3)$eigua ## [1] 8.02815, (h) Podeu acceptar que els errors de la regressié de (a) s’ajusten a una distribucié normal N(O, S)? lels de la regressis lineal de (c)? ks test (Reg Tot §residuals, "pnonn” jmean=0,sd=summary (Reg. Tot) §sigma) se sexs baw/Dowalonde felis (1) hom us 2162020 ‘Mawnitiqus It Fall 6h Reprssi linea multiple “ ## One-sanple Kelmogorov-Smirnov test “oe ## data: Reg.Tot§residuals ## D = 0.22107, p-value = 0.3977 ## alternative hypothesis: two-sided ke. test(Reg.35residuals, "prom" ,mean=0, 2 “ ## One-sanple Kelmogorov-Smirnov test “oe ## data: Reg-35residuals ## 0 = 0.26887, p-value = 0.19 ## alternative hypothesis: two-sided (i) Quin coeficient (sense comptar el terme independent) de la regressié lineal de (a) té un error tipic més gran? Ide la de (c)? suimary (Reg -Tot )fcoefficients[-1,2] #4 control casa fallers © ‘Tests —-Extres Socrative ## 0.2581204 0.2587542 0.2145658 0.2589293 6.6592371 0.4214204 summary (Reg -3)§coefficients[-1,2] ## control fallers Eztres ## 0.2255387 0.1702519 1.5162853 () Calcutau els intervals de confianga de! 95% per als coeficients de la regressié lineal de (a). Feu el mateix amb els de la de (¢) confint (Reg. Tot ) “oe 2.58 97.58 ## (Intercept) -94.81898726 18.7398760 ## Control, -0.09121093 1.092427 ## Casa -0.32045315 08729236 ## Tallers -0.22278612 0.767932 #2 Teste -0.77104880 0.4231351 ## Extres -10.91344882 19.7990080 ## Socrative -1.04613757 0.8974567 confint(Reg-3) “ 258 97.58 ## (Intercept) -71.93631256 -0.3147896 ## control, 0.06452993 1.0573445 ## Tallere -0.14969074 0.597533, ## Extres 0.70442187 7.3790646 sess baw/Dowlondefelisbecks (1) hom 212020 ‘Mawnitiques IE Full ob Regie tinea! iltiple (k) Hiha algun coeficient de la regressié lineal de (a) que pogueu rebutiar que és igual a0 amb nivell de significacié 0.05? | de la de (c}? lary (Rag. Tot )§coafficienta[-1,41<0.05 #4 control casa Tallers © ‘Tests —-Extres Socrative ## FALSE = FALSE = FALSE FALSE «= FALSE = FALSE, summary (Reg .3)§coefficiental-1,4]<0.05 ## control Tallere ## TRUE FALSE TRUE (0) Quina és la conclusié de ANOVA de la regressié lineal de (a)? Ila de la regressié lineal de (c)? lary (Reg. Tot) “oe ## call: ## In(onmla = Final - Control + Casa + Tallere + Teats + Extres + #4 — Socrative, data = Dades) “oe ## Residuals: 4 Min 1g Median 390 Maz ## -9.1173 -5.0737 0.1883 3.4830 16.5852 “oe ## Coefficients “ Estimate Std. Error t value Pr(>|t|) ## (Intercept) -38.03956 24 62243 -1.545 0.1609 ## control, 0.50402 0.25812 1.953 0.0866 ## Casa 0.27624 0.25875 1.068 0.3169 ## Tallers 0.27200 0.21457 1.268 0.2408 #2 Teste -0.17396 0.25893 -0.672 0.5206 ## Extres 4.44278 6.65924 0.667 0.5234 ## socrative -0.07M 0.42142 -0.176 0.8644 ae #8 Signif. codes: 0 '*##' 0,001 '#¥' 0.01 '#' 0.05". OL “oe ## Residual standard erro 1 8.721 on 8 degrees of freedan ## Multiple R-squared: 0.7512, Adjusted R-squared: 0.5645 ## e-statisti 4.025 on 6 and 8 DF, p-value: 0.03699 se sexs baw/Dowalonde felis (1) hom 2162020 ‘Mawnitiqus It Fall 6h Reprssi linea multiple “ ## call: ## In(£onmla = Final - Control + Tallers + “oe ## Residuals: data = Dades) “ Min 1g Median 39 ea ## -10.8046 -3.5477 -0.1144 2.0978 20.9971 “oe ## Coefficients “ Estimate Std. Error t value Pr(>|t|) ## (Intercept) -36.1256 16.2703 -2.220 0.0483 * ## control, 0.5609 0.2255 «2.487 0.0302 # ## Tallers 0.2250 © 0.1703«1.322 0.2131 ## Extres 4.0417 1.8163 2.668 0.0220 ¥ a = #8 Signif. codes: 0 '*##' 0,001 '#¥' 0.01 '#' 0.05". OL “oe ## Residual standard error: 8.028 on 11 degrees of freedan ## Noltiple R-squared: 0.71, Adjusted R-squared: 0.631 ## E-statistic: 8.979 on 3 and 11 DF, p-value: 0.002705 ()) Suposem que un estudiant va treure un 5 sobre 10 de totes les notes excepte el final. Quina nota esperay que tregués del final? Feu-ho amb els dos models. Estudian Jata.frame(Control=50,Casa=50,Tallers=50, Test )Socrative: predict .lm(Reg.Tot,Bstudiant) “oe 1 #4 2437221 predict .1m(Reg.3,Estudiant) “oe 1 #4 23.38159 (m) Suposem que un estuaiant va treure un 5 sobre 10 de totes les notes excepte el final, Donau un interval de confianca per a la seva nota esperada del final. Feu-ho amb els dos models. predict .Im(Reg-Tot Batudiant,interval="confidence" ) “oe fit we upr ## 1 24.37221 -6.76172 55.50614 predict .1m(Reg.3,Estudiant, interval="confidence") “oe fit lwe pr ## 1 23.38159 1.76431 34.99887 (n) Suposem que un estudiant va treure un 5 sobre 10 de totes les notes excepte el final. Donau un interval de confianca per a la nota que va treure del final. Feu-ho amb els dos models. se rdaetiatiaw/Dowalondsflo bs (1)hoa1 516 2162020 ‘Mawnitiqus It Fall 6h Reprssi linea multiple predict .Im(Reg-Tot Batudiant interval="prediction") “oe fit we pr #8 1 24.37221 -12.6921 61.43652 predict .1m(Reg.3,Estudiant, interval="prediction") “ fit we upr #8 1 23.38159 2.234054 4452832 se sexs baw/Dowalonde felis (1) hom 61s

You might also like