You are on page 1of 11
Regresién Lineal Bl anlisis de regresién es una técnica para investigar y modelar la relacidn entre vasiables. Aplicaciones de regre- sign son numerosas y ocuren en casi todos los campos, incluyendo ingenieria, la fisica, ciencias econémicas, ciencias Diologicas y de la salud, como también ciencias sociales. Para que se usa? Utilizados para varios propésitos, incluyendo los siguientes; 1. Deseripeién de datos: Ingenieros y cientificos frecuentemente utilizan ecuaciones para resumir tun conjunto de datos. El andlisis de regresin es itil para describir los datos. 2, Estimacién de parémetros: Suponga que wn cizcuito eléetrico contiene una resistencia conocida de R (ohms) Diferentes corrientes pasan a través del circuito y el correspondiente voltaje es medlido. El diagrama de dispersi6 podria indicar que el voltaje y la corriente estan relacionados por una linea recta que pasa por el orgen con R (debido a que el voltaje V y la corriente I estan relacionados por la ley de Obm V = IR). El andlisis de regresién podsfa ser utilizado para ajustar este modelo a los datos, produciendo un estimado de la resistencia desconocida. 3. Para prediccién y estimacién: Algunos casos de esta utilidad del anzlisis de regresin son: 1 La respuesta de un cultivo al vaviar la cantidad de los fertilizantes; el objetivo puede sex establecer la forma de la relacién, o predecir Ia combinacién optima de fertilizantes. b La relacisn entre vatias medidas meteroldgicas y la produccién del cultivo; cl ms obvio objeti ser tratar de entender los efectos meterolégicos sobre el crecimiento del cultivo. vo podsfa En ol andlisis de regresién se pueden distinguir dos tipos de variables: variables predictoras y variables respuestas. la diferencia entre variable predictora y respuesta es no siempre completamente clara y depende algunas veces de nuestros objetivos. Algunos nombres conocidos para las variables prodictoras y respuestas son: Variables predictorioas — vaviables de entradas — entradas — variable x — regresoras — variables indepen- dientes. Variables respuesta — variables de salida — salida — variable y — variable dependiente. Modelo Lineal ‘La més simple relacién entre dos variables es una linea recta, En donde se tiene pares de observaciones de yy x donde y, la variable dependiente, se asume dependiente sobre 2, la variable independiente, Se considera wn modelo lineal cuando los parmetros ocurren de manera lineal, asi por ejemplo: Lys Bo 1% Modelo lineal o de primer orden, 2. y= Bo + B12 + G:2* Modelo cuadratico o de segundo orden. Ing. Pablo Jose Pabén 5 ‘MSc. Cosér Rendon ‘UNIMAR - Fac. Ingenierias INDICE GENERAL Metodos para solucion del modelo lineal o de primer orden 1. Covarianza Para poder encontrar los terminos fy (intercepto) ¥ ji (pendiente) del modelo de primer orden haciendo uso de Ia covasianza, se debe seguir un procedimiento estadistico, para ello se deber tener en cuenta las siguientes expresiones Media 0 promedio: = Verano? =} 5, 97 yD Covatianza: relacion lineal entre dos variables en este caso Y y X: oxy = s Para hacer uso del metodo por eovarianza se debe crear una dispercién de datos con el fin de verificar si se trata do una linea recta, ver figura 1 : al depart Figura 1: dispercidn de datos Una ves se verifica que los datos se comportan linealmente se procede hacer uso de los términos ant el fin de encontrar ( y #1, $e proceders a realizar la siguiente tabla: x x —#[y—y (ya? OF (= D019) esp] ssp] so] 6s En a3 320 7o| s0| 30/55 30 303 365 s00| 80] 70] ios w0 i103 735 v30| 950/200] 195 2000 3803 3900 510| 530] -220| 225 2340 506.3 1950 szo| 6o9| -uo| 155 1210 24033 1705 roo] —750|-30[ -05 30 03 15 730| 739] oo 25, 00 63 20 sz0| 850] 90] 105 B10 10:3 38,5 so0| 880 130/125 169.0 1563 1625 730] 7.0] 50] 15 250 23 73 coo| 63.0| 130| tas 169.0 1563 1625 Dei- 2? = 1500 | So. - 9? = 1701 | Ye, --901— 7 = 1626 3 | y= 785 347 of = 1457 my = 1355 Con esta informacién se hace uso de la siguiente ecuacién para encontrar By y By Ing. Pablo Jose Pabén 6 MSc. Cesar Rendon UNIMAR - Fac. Ingenierfas INDICE GENERAL Pendiente: ) = Ahora con la ecuacién y ~ f +612, se despeja do, haciendo uso de los promedios de 2 y y T= So +82 Intercepto con el eje: fo = 9 — AF Con la informacién de la tabla se tiene que: 6, = 1.08 y 8 muestra en la figura 2. Jo que muestra una recta como la que se t i Figura 2: recta de ajuste para los datos Esta gréfica muestra la recta que mejor se ajusta al comportamiento de los datos de la anterior muestra. Ing. Pablo Jose Pabén ‘MSc. Cosér Rendon ‘UNIMAR - Fac. Ingenierias INDICE GENERAL Ing. Pablo Jose Pabén 8 MSc. Cesar Rendon Teoria del error Cualquier medida que se haga en cualquier experimento siempre (y es que siempre) esta sujeta a un erxor, por ejemplo en fisica cuando hablamos de la velocidad de un auto y decimos que este va a 60 Kma/hora no es del todo cierto es probable que vaya a 60,0002 Ken/hora, as que el error aduiere mucho sentido en cualquier medida ya que no sabemos el valor verdadero (por as{ decirlo ya que el concepto de verdad también tiene sus problemas) por eso uusamos una cantidad adicional al dato para especificar que podria ser un poco mayor o tn poco met Por Ejemplo se midié una varilla de acero con un metro milimétrico y la longitud fue: L = 25,3.10,5 esto quiere decir que la medida podria ser 25,8 (25,3 + 0,5) 6 24,8 (25,3 Errores Aleatorios Son errores debido a la inevitable limitacién de la calidad de los instrumentos 0 también pueden ser producidos por la naturaleza misma del fenémeno, Sélo se pueden eliminar parcialmente si se refina el equipo o el método analitico, y repitiendo las medidas (como por ejemplo, leer una temperatura, el pH o medir una velocidad bajo las mismas condiciones) Los errores aleatorios pueden ser analizados con estadistica (pero no entraremos en detalle), para apreciar un error se deben tomar varias medidas de la misma cantidad 2’ o evento, Iniciemos con un tratamiento para un evento que se le hace N-medidas, cacla medida tiene un valor de: 21, 22)25) 28 El valor medio de las N-medidas seré (er tap test. t2y) a Finalmente las ecuaciones 1 y 3 de esta seccién nos da el valor verdadero de una cantidad 2” seré: a =2te(t) 2! =24Ae a) Donde se ha renombrado la variable # = x se conoce como mesurando y € (2) = A es el enor estndar de la medicién, Ejemplo 1 Se mide la longitud de una molécula y los resultados son: 90,00; 92,20; 94,90; 92,70; 91,6; 88,20; 92,00; 98,20; 96,00 (en Angstroms - 10-%m = 14) Solucién: [La ecstacién de valor medio (1) para 9 datos: a ty tay tag + ay + ag +25) Ing. Pablo Jose Pabén 8 ‘MSc. Cosér Rendon ‘UNIMAR - Fac. Ingenierias INDICE GENERAL Donde N =9 y tenemos datos enumerados con #1 = 90.00 ... 2 = 96.00 1 oan 82.204 945049270 + 91.6+88.20 + 12.00 9820 + 86.00) Extonces ol valor modio es: #= 92.87 (Bste esol mesurando x) Mientras que la desviacin estdndar (2) para 9 datos ° [00,00 — 92, 87)? + .. + (91,6 ~92,87)° + .. + (90,00 ~ 92,87)"] V 18,2309 ~ 0, 4480 + 4, 1209 + 0,0289 + 1,6129-+ 21,8089 + 0,7560 + 28, 4089 + 9, 7900] el ertor lo calculamos con (3) (Hste valor es Ax) e@)= Entonces nuestro dato 2! Bi Ar seré: a! = 92,874 1,02 Ahora nos queda la duda de las cifras que debe tener el dato, esto lo trataremos inmediatamente, el tema se llama cifras signifiativas para datos con exror Nota: Cuando modimos con un instrumento poco sensible, la medida siempre nos dar lo mismo, caso de medir nuestra altura, entonces aqui el error lo tomamos de Ia escala rafnima del instrumento, en este caso lem, Cifras Significativas Llamaremos cifras significativas de una medida al numero de digitos seguros mas un digito dudoso, al vltimo digito del mesurando se le conoce como dudoso, pues en este digito hay incertidumbre y es aqui donde esta el error. (Nota: El cero a la izquierda no cuenta como cifra significativa y el error de ahora en adelante seré expresado solo con una cifta significativa) Cuando obtenemos tun dato, y este contiene cierto numero de digitos tanto en el mesurando como en el exror, tenemos que escribir el numero de digitos en el mesurando de una manera coherente con el error, por ejemplo: Bl timo numero del mesurando se conoce como incertidummbre y éste coincide con el exzor, pues las dos estén inme- diatamente después de la coma, podemos decir que en el anterior ejemplo el mesurando es coherente con el error ya ‘que la incertidumabre y el error se hribican en el mismo digito, Si cl error tiene més de una cifra significativa (CS) debemos redondear todas las démas cifras, del ejemplo anterior teniamos que 2' = 92,874 1,01, pues es un claro ejemplo de que la incertidumbre no es coherente con el error y éste tiene mas de una CS, primero tenemos que arreglar el error, e! cual debe tener solo una CS, entonces i] Ahora nuestro dato x’ sera: 2! = 92,87 + 1, pero persiste el problema que la incertidumbre no esta en el mismo digito ‘que el error. Se debe tratar el mesurando Ar =1,01 = fot: Asi ya tenemos un dato x’ en donde la incertidumbre es coherente con el error 2’ = 93 +1 estén un digito antes de la coma. Ing. Pablo Jose Pabén 10 MSc. Cesar Rendon UNIMAR - Fac. Ingenierfas INDICE GENERAL Hagamos un ejemplo més, escribir de forma adecuada el valor de la velocidad que atroja un estudio sobre los veh{culos en carreteras intermunicipal de v’ = 60,63 + 0,68 Primero vamos a arveglar el error, puesto que tiene 2CS y solo debe tener 1CS) Av = 0,08 = 0,68"! =o Ahora nos ocupamos de que la incertidumbre sea coherente con este nuevo error, ¥ como nos damos cuenta el error esta un digito después de la coma y Ia incertidumbre esta dos digitos después de la coma, asi que arreglamos esto. = 60, 65 = 60, 65 Y nuestro dato de velocidad seré v' = 60,6 + 0,7. Error en Mediciones Indirectas Ya sabemos como obtener un error de una medida o de muchas medidas hechas directamente con los instrumentos, ahora vamos a aprender como obtener ol error cuando se tiene que calcula una cantidad a partir de estas medidas, por ejemplo calcular el rea (A) de la tapa de un pequeo libro, para hacerlo necesitames saber su alto (h’)y su largo (1), en cada caso lo haremos con una regla, entonces la escala maima de la regla es Imm, el error es Imm en cada dato, pero éste se propaga al érea quien también tend un error heredado de los errores en sus lado. A shel shat MhelbAl=A4AA La pregunta es cuanto vale Ia cantidad A’ = A+ AA?, para hacer propagacién de errores. sx’ yy talque x’ = 24 Ary y =y Ay, y sea © un numero real (una constante), las operaciones entre xy" y © sera te caleulo necesitamos algunas reglas de ean dos dat Suma Producto por una constante v= (x+y) = (Ox) + (Any (5) crest lelAc (8) Resta Division Fova@-ysVarr ay © v2, |e ay ) Producto de dos datos yoy ly y Potencia » wey! (7) 2 a2" 4 |no™ Ar (a0) Ejemplo Si log lados de un libro son hi = (35,2 0,d)em y U! = (23,9 0, 6)em, cual es el dea de una de sus caras? Primero revisamos que el error y Ja incertidwmbre sean coherentes en los datos, como Io son passmos a sacar Ia informacion: h = 35,2, Ah = 0,4, 1 = 23,9, Al = 0,6, ahora identificamos el tipo de propagacién del error, como A= he! la propagacién usada serd la del producto, ajustamos la ecuacién 7 a e fos nuevos datos AaWalhetetnetly A’ = 95,24 28,9 £|95,2428,9| A’ = 481,28 + 481, 28| [1,29 10 A’ = 481,28 + (481, 28) Ing. Pablo Jose Pabén i ‘MSc. Cosér Rendon ‘UNIMAR - Fac. Ingenierias INDICE GENERAL A 181, 28 + 13, 259 Nuestra érea tiene un problema, el error no tiene una CS y no es coherente con la incertidumbre, pues lo arreglaremos, ‘escribimos e] error como notacién en potencia de 10 y luego lo dejamos en una sola CS [H) 10* 'Y el mesurando debe tener la misma notacién el error, asf que hay que evarlo a potencia de 10” y luego redondear hhasta hacer coincidir el digito de la incertidumbre con el error, .A = 13, 259 = 0, 18259 + 10? = 0, 13+"259 + 107 = A= 481,28 = 808 » 10% 8128 + 10? = 10 Asé maestro valor de drea sera A! = A+ AA = 4,8 10? +0.1 «10? = (4,8+0,1) + 104m? emp Sig Be toe xy tm dao con vl = (8-008) y= 105708 Col ol ar de a rv cen este hugar? Primero nos damos cuenta que en el dato de t? Ia incertidumbre del mesurando no corresponde con el error, asi que Io debemos redondear. U = 1,057 40,02 = 1,087 + 0,02 = 06 + 0,02 2x Ahora ya podemos propagar el error, vatnos a identificar el tipo de propagacién como la ecuacion es g = ‘tenemos 3 propagaciones, Nota: cuando hay mas de una propagacién el redondeo solo se hace en la propagacién final, cuando ya se vaya a centregar el resultado, 1. Primera propagacién: Producto por un escalar 22’, Identificamos ¢ = 2, x = 5,23, Ax = 0,05 y aplicamos (8) 2a! = 2x &|2| Ax = 2(6, 23) + 2(0,05) = 10,46 + 0,1 t 2. Segunda propagacién: Potencia t, Identificamos n = 06, At = 0,02 y aplicamos (10) e 2 = [2] ae= (1, 06)? = f2(2,06)+ (0,02) 1, 1236 + (2, 12)(0, 02) = 1, 1236 +0, 0424 B= resultado ~ de ~ 20 “B= resultado = de aeny? (Aw) 6 — (=) (3) - Sam =| a y (PAs) +(e) 3. Tercera propagacién: Divisién = 4 = 9,200 +9, 00/9, 139810 9,309 + 0,382 Ahora que tenemos el resultado final ya podemos dejar el error con una CS y redondear hasta hacer coincidir el igito de Ia incertidumbre con el error en el valor deg +142, 3994 + 1 gf = 9,309 0,363°* MUY IMPORTANTE cuando en una medida indirecta los ediculos arrojan un mesurando con el mismo orden de magnitud o menor que el error entonces se considera esta medida como cero! Ing. Pablo Jose Pabén 12 MSc. Cesar Rendon Introducci6n a ROOT ROOT es un marco de trabajo para andlisis de datos cientificos desatrollado por Centro Buropeo de Investigaciones Nucleares (CERN siglas en francés), facilita ajustes de datos a funciones, tiene un entoro especial para trabajar fisica de particulas y fue desarrollado en 1994 en el lenguaje C++. En nuestro entomo solo utilizaremos el ajuste de datos, ingresaremos los valores de la variable independiente(s) y la variable dependiente(y) con su respectivos errores en caso y vamos a ajustar los datos a un polinomio cuyos pardmetros nos darn informacién importante para el desarrollo de las laboratories. NO vamos a necesitar grandes ni complicadas sentencias para logiar nuestros ajustes, las enumerate a continuacién = Ingreso de Datos El ingreso de datos lo hacemos en un vector flotante de la siguiente manera: Nota: Al terminar cada linea se da un enter!! float x{n] = (21.22,235 044} Rloat y |r} = {1,421 Ysa float dz [n] (dx, dz, darg,..., drm} float dy {n] = {dy dy2, dys, -—.d¥n) x son lo valores de la variable independiente ¥ son Tos valores de la variable dependiente dese eror de la variable independiente OY eal error dela vatiable dependents nese aumero de datos que se tiene y deben ser los mismos on la variable independiente y la variable dependiente NOTA: No puedes solapar los valores en el vector todas la medidas uno en la posicién uno y asi sucesivamente, la posicién [I] de 2: y yi debe corresponder en la misma posicién con dy y dy: que es el error de zi y vi respectivamente, cuando alguma variable no tenga error simplemente no se exea el vector de error dx o dy. La separacién de datos en ROOT de hace con la coma(,), mnientras que la separacién decimal se hace con punto(.). + Ponemos los Datos en el Plano Para guificar utilizamos la funcién TGraphErrors asi TGraphErrors nombre(n,x, 4,44) = Ajustar los datos a una curva y gréficamos Para ajustar los datos que ahora son puntos sobre el plano utilizamos la funcién Fit Para una funcién lineal ROOT ajusta con poll = Py + Piz oy = b+ max nombre. Fit("polt”) nombre. Draw" AP") Cuando ejectamos el comancdo Draw aparece una imagen con el ajustey Ios punto, ademas tiene la informacién, de los parmetros de ajuste donde el pardmetro Py es el corte con el eje y el parémetro P) es la pendiente de la recta Para una funcién cuadrética ROOT ajusta con pol? = Py +Pyz + Py? oy = e+ bs +az* nombre. Fit("pol2”) NOTA: Dependiendo de la funcién que vayan a ajustar tendran que compararla con la funcién de ajuste de ROOT ‘pol2? para que le encuentyen significado a los pardmetras Ps, Py y Pe Ahora haremos un ejemplo para ilustrar lo anterior. Ing. Pablo Jose Pabén 13 ‘MSc. Cosér Rendén UNIMAR - Fac, Ingenierias INDICE GI Ejemplo La ley de Ohm dice que el Voltaje(V) es igual a la corsiente(1) por la resistencia(R) dejaremos claro con un experimento: Se hace variar resistencia y se mide la corriente del circuito con un voltimetro, los datos -R*I. Para probarlo lo Je de una fuente que alimenta un circuito con una, colectado son los siguientes al “Media | Voltage | Corriente | Zo | 00am 2 30 | 0,010 3 0,060 4 oo 5 0.210, Cuadro 1: Expe Como la variable que controlamos fue el voltaje (AV fue la corriente que sera la dependiente (esta debe quedar despejar I (AT = +0.001) V-ReI Resta mult v EL asi’ ya esta sola R y y (3) v Esta ecuacién 1 = © la podemos ver como 1 " R recta (y = mz-+#) caya variable dependiente (y) es 7 (aa) es & y su corte con el eje (b) es cezo ya que este ter (a) es By je (b) yaa comparaciéa de polinomios) st variable independiente (x) es 'V imento OHMMM 0,3) entonees esta es la independiente y la que medimos sola}, asi que tenemos que cambiar la ecuacién V=RFT y iplicando pasa a dividir cs independiente (osea 'y’) +V y ahora nos damos cuenta que es la ecuacién de una la pendiente de esta recta rmino no aparece en la ecuacién (Eiste andlisis se hizo por Asi que vamos a ajustar con 'poll! (poll = Py+P,2) y experamos que en el parémetro Py el error sea muy parecido al mesurando para poder asegurar que este es cera 1 Primero ingresamos los datos a los vectores ‘Ty float V [5) = {2.0,3.0,5.0,7.0,9.0} {float 15] = (0.020, 0.040, 0.060, 0.140, 0.21 float aV [5] = (0.3,0.3,0.3,0. {float al {5} = {0.001, 0.001, 0.001, 0.001, 0.001} 2. Pondremos los vectores en el plano ‘TGraphBrrors leydeohm(5, V,I,4V,al) 3. Ajustamos a poll leydeohm. Fit("polt”) 4, Graficamos leydeohm Draw ("AP") Para gravar la imagen seleccionamos del menti File ‘quedaré gravado como 'el’ en formato paf Para que aparezcan los pardmetros en la figura se de! Ja opeién save y nego vamos a ef-pdf y nuestro archivo ‘be ir a la pestafia "Option" y seleccionar "fit parameters” Ing. Pablo Jose Pabén MSc. Cesar Rendon UNIMAR - Fac. Ingenierias {NDICE GENERAL Proceso Experimental Pida al docente el conjunto de datos que sera ajustados en esta préctica gréfique sin ajustar y seile cual debe ser Ja fameién a ajustar. Bsto se hace asf en ROOT: Después de aplicar el TGraphErrors TGraphErrors nombre(n,2,4 42,44) Pones el comando’ nombre. Draw("AP”) Entonces en la gréfica no aparecerd cl ajuste solo aparcerdn los puntos de los datos: Una ver escogido la funcién de ajuste (poll, pol2, pol3, .. ete), eseribes nombre. Fit("polN" nombre. Draw("AP”) Cuestionario 1, Qué significado tiene cada tno de los parthetzos? 2, Ciial es el valor de Ia resistencia elétzica? Ing. Pablo Jose Pabén 15 ‘MSc. Cosér Rendon

You might also like