You are on page 1of 24

Ajuste a frmulas no-lineares

El ajuste de datos experimentales a frmulas no-lineares, al ser obvio que los datos no podrn ser ajustados ni a una recta de mnimos cuadrados ni a un polinomio de grado superior, generalmente requiere de algn modelo matemtico no-linear que posea ciertas caractersticas que tal vez hasta puedan ser anticipadas tericamente. Tmese por ejemplo el siguiente conjunto de datos experimentales:

La densidad de los datos parece agruparlos en torno a algo parecido a una curva logartmica de la forma y=a+ln(x), de la cual podemos mostrar los siguientes ejemplos para a=0:

La obtencin de las ecuaciones normales para llevar a cabo el modelaje con ecuaciones nopolinomiales se trata de manera similar al caso polinomial. La ecuacin general de tres trminos es: Y = A + Bf(X) + Cg(X)

en donde f(X) y g(X) son funciones cualesquiera de la variable X. Al igual que como se hizo desde que obtuvimos las ecuaciones normales para la recta de mnimos cuadrados, definimos las distancias (residuales) como: d = A + Bf(X) + Cg(X) - Y

Elevando los residuales al cuadrado y sumndolos, tomando tras esto las derivadas parciales con respecto a los tres parmetros A, B y C, obtenemos las ecuaciones normales: AN + Bf(X) + Cg(X) = Y

Af(X) + B[f(x)] + Cf(x) g(x) = f(X)Y

Ag(X) + Bf(x) g(X) + C[g(X)] = g(X)Y

Esta es la justificacin para la extensin del mtodo matricial general para cualquier tipo de ecuacin que pueda ser linearizada.

La forma ms inmediata de poder extender la cobertura del mtodo de los mnimos cuadrados para poder utilizar modelos matemticos no-lineares para poder ajustar datos experimentales a frmulas no-lineares es linearizar la frmula, lo cual muchas veces se puede llevar a cabo con procedimientos matemticos elementales. A manera de ejemplo, la siguiente frmula no-linear: y = Ae-Bx

se puede linearizar tomando logaritmos naturales de ambos lados, con lo cual obtenemos: ln(y) = ln(Ae-Bx) ln(y) = ln(A) + ln(e-Bx) ln(y) = ln(A) - Bx

lo cual graficado sobre papel logartmico nos d una lnea recta.

Sin entrar en demasiados detalles, tal vez llegar como una buena noticia para muchos el saber que el mtodo matricial visto previamente tambin puede ser utilizado para llevar a cabo el ajuste de datos a frmulas para las cuales no parecera haber una solucin sencilla bajo el mtodo de los mnimos cuadrados. Esto se podr apreciar mejor con la solucin de unos cuantos problemas que demuestran la extensin del mtodo matricial para poder modelar datos con frmulas no-lineares.

PROBLEMA: Experimentalmente, se ha encontrado que la capacidad calorfica del grafito depende de una manera como lo documenta la siguiente tabla de datos en la cual se proporciona la capacidad calorfica Cp (el subndice p indica que las mediciones fueron llevadas a cabo a presin constante, o sea "al aire libre") obtenida para varios valores de la temperatura T expresada en grados absolutos (grados Kelvin):

La experiencia ha confirmado tambin que una frmula a la cual se pueden ajustar muy bien estos datos experimentales es la siguiente:

Determinar los valores de las constantes A, B y C, para la frmula proporcionada.

Usando el mtodo matricial, podemos linearizar el problema haciendo los valores en lo que vendr siendo la tercera columna de datos iguales a 1/T. Formamos primero el vector rengln con los valores de Cp: Y = [2.08 2.85 3.50 4.03 4.43 4.75 4.98 5.14 5.27 5.42]

Tras esto, la matriz de datos ser la siguiente:

Nuevamente, repetimos los clculos propios del mtodo matricial formando la matriz de coeficientes: K = XT X

y el vector constante: V=YX

para obtener el vector solucin: S = K-1 VT

lo cual nos d los coeficientes: A = 3.37

B = 0.00191

C = -177097

con lo cual la "curva de mnimos cuadrados" es: Cp = 3.37 + 0.00191T - 177097/T

La curva, superimpuesta sobre los datos experimentales originales, es la siguiente:

PROBLEMA: La presin del vapor de agua est relacionada directamente con la temperatura. Experimentalmente se obtiene con mediciones llevadas a cabo en un laboratorio que la presin, medida en torrs, se corresponde con la temperatura, medida en grados centgrados, segn los valores mostrados en la siguiente tabla:

Despus de echar un vistazo a varias curvas disponibles, se encuentra que un modelo matemtico que pudiera describir este comportamiento es el siguiente:

en donde la temperatura est expresada no en grados Centgrados sino en grados Kelvin (para lo cual hay que convertir grados Centgrados a Kelvin sumando 273.15) y en donde A y B son parmetros a ser estimados mediante un "ajuste de mnimos cuadrados" de acuerdo con los datos obtenidos experimentalmente en base a la tabla. Obtener A y B.

Montamos primero con los nueve valores de la presin P el vector rengln que hemos estado llamando Y (obsrvese que estamos tomando el logaritmo natural de cada valor, para corresponder con la variable que est puesta del lado izquierdo de la frmula): Y = [ln(17.535)_ln(31.824)_ln(55.324) ... ln(760.0)]

tras lo cual montamos la matriz de datos:

Formamos ahora con la ayuda de algn paquete computacional para el manejo de matrices formamos la matriz de coeficientes: K = XT X

y el vector constante: V=YX

tras lo cual evaluamos el vector solucin S: S = K-1 VT

obteniendo:

En este vector solucin, el valor superior es el coeficiente numrico A y el valor inferior es el

coeficiente numrico B. En base a esto, la ecuacin "mejor ajustada" de acuerdo al criterio de los mnimos cuadrados para los datos dados es: ln P = 20.459 - 5152/T

Una vez obtenida la frmula, podemos graficar la curva que representa el "mejor ajuste" a los datos, superimpuesta sobre los datos discretos de los cuales fue obtenida. Aunque podemos trazar la grfica utilizando un eje vertical logartmico (el lado izquierdo de la ecuacin), tal y como se acostumbraba en otros tiempos en los cuales la disponibilidad de programas computacionales o inclusive de tiempo de computadora compartida era un lujo casi inaccesible obligando al uso de papel logartmico o semi-logartmico, hoy ya no es necesario recurrir a tales artificios, y podemos "despejar" la frmula poniendo explcitamente la presin P en funcin de la temperatura T, obteniendo as la siguiente ecuacin y la siguiente grfica de la frmula con los datos discretos superimpuestos sobre la misma:

Podemos ver que el ajuste de los datos experimentales discretos a la frmula es bastante bueno, podramos decir casi ideal.

Esta ecuacin es conocida como la ecuacin de Clausius-Clapeyron. Es importante sealar que el modelo general de la ecuacin fue obtenido primero tericamente en base a argumentos basados en la termodinmica, y posteriormente el modelo fue ajustado llevando a cabo mediciones en el laboratorio con el fin de determinar los parmetros A y Bcon los cuales el modelo describe ya con nmeros algo que se puede confirmar en el laboratorio.

PROBLEMA: La energa de la brecha de banda de un material semiconductor, Eg, expresada en electron-volts (eV), puede ser determinada de la siguiente frmula: 1/ = = Ae-(Eg/2kT)

en donde es la resistividad elctrica expresada en ohms, es la conductividad elctrica expresada en mhos, k es la constante de Boltzmann que podemos tomar como 8.61x10 -5, yT es la temperatura absoluta (en grados Kelvin). Los siguientes datos experimentales fueron obtenidos de un semiconductor intrnseco:

Linearizando primero la frmula tomando los logarimos naturales en ambos lados de la misma, y

llevando a cabo tras esto un "ajuste de mnimos cuadrados" sobre los datos experimentales, obtener Eg para este semiconductor.

Primero llevaremos a cabo la linearizacin tomando logaritmos naturales de ambos lados de la frmula:

Al aplicar valores numricos, esta es ya esencialmente la ecuacin de una recta, en dondeEg/2kT es la pendiente de la recta.

Para este problema llevaremos a cabo algunas modificaciones que nos permitirn aligerar un poco la ejecucin de los pasos que requiere el mtodo matricial. Empezaremos con el vector rengln que normalmente escribiramos despus de tomar los logaritmos naturales de cada uno de los valores de R, escribindolo ahora como un vector columna:

No hay ningn inconveniente en lo que acabamos de hacer siempre y cuando tomemos la transpuesta de Y a la hora de hacer los clculos.

A continuacin, podemos definir la matriz de datos. Para ello, es importante observar que hay que convertir de grados Centgrados (o grados Celsius) a grados Kelvin (o grados absolutos) cada una de las temperaturas dadas en la tabla de valores experimentales (este es un paso necesario al resolver muchos problemas de este tipo, ya que en las frmulas tericas de muchos modelos cientficos las referencias a temperaturas son en grados Kelvin, no grados Centgrados), para lo cual es necesario sumarle a cada temperatura el valor 273.15 en virtud de la frmula: K = C + 273.15

Haciendo Z=273.15, la matriz de datos resulta ser:

Ahora, en vez de usar tres frmulas matriciales diferentes como lo venamos haciendo en los problemas anteriores, tal vez nos resulte ms cmodo usar una sola. La podemos obtener del modo siguiente: S = K-1 VT S = (XTX)-1) (YX)T

El vector rengln de datos Y lo podemos obtener tomando la transpuesta del vector columna de datos Y: S = (XTX)-1 (YTX)T

Usando ahora la propiedad de la transpuesta del producto de dos matrices: (AB)T = BTAT

llegamos a la frmula condensada nica: S = (XT X)-1 (XT Y)

Metiendo directamente la matriz de datos y el vector de datos (aqu es donde el investigador puede

comprobar la comodidad y las ventajas de usar cierto paquete computacional cientfico para el manejo de matrices), obtenemos la siguiente solucin en forma de un vector columna:

Entonces: - Eg/2kT = -3.483 103

Eg = 2(8.61105)(3.483103) Eg = 0.6 electron-volts

PROBLEMA: Un ejemplo notable de crecimiento exponencial lo dan las muestras de cultivos de bacterias. En la siguiente tabla, supngase que la cantidad de bacterias por unidad de volumen est dada por la variable C despus de T horas de cultivo.

Hacer un ajuste de mnimos cuadrados de los datos a una curva exponencial del tipo Y=ab x. Estimar el valor de la concentracin de bacterias cuando el tiempo transcurrido es de 7 horas.

Llevando a cabo los mismos pasos que los mostrados en los problemas anteriores, la curva exponencial de mnimos cuadrados resulta ser: C = (32.14)(1.427)T

El valor de Y cuando ha transcurrido un tiempo de T=7 horas es, de acuerdo con esta frmula: Y = (32.14)(1.427)7

Y=387.27

Obsrvese que aqu se est llevando a cabo una extrapolacin, salindonos del rango de valores medidos para extender su alcance ms all del mximo rango cubierto por los datos que generaron la curva. Este es a fin de cuentas uno de los principales propsitos de las curvas de mnimos cuadrados: permitirle a los investigadores hacer una prediccin cuantitativa que de otra manera sera muy subjetiva y propensa al error. De cualquier modo, el investigador inteligente no se limita a un solo modelo matemtico, y hace lo posible por probar otros modelos en caso de que haya factores adicionales que tengan que ser tomados en cuenta para un mejor "ajuste" de datos.

La grfica de la frmula obtenida, superimpuesta sobre los datos experimentales discretos a partir de los cuales fue generada, es la siguiente:

Podemos ver que el ajuste de los datos a la frmula es excelente. Existen mucho fenmenos naturales adems del crecimiento de bacterias que pueden ser descritos por un modelo exponencial como el que se acaba de utilizar aqu.

Este problema es representativo de aquellos problemas que permiten hacer pronsticos con fenmenos que podran tener que ver inclusive con la salud pblica en casos de una epidemia fuera de control.

PROBLEMA: Dados los siguientes pares de datos (Xi,Yi): (1, 5.65) (2, 27.32) (3, 66.7) (4, 98.2) (5, 159.5) (6, 246.3) (7, 325.7)

hacer un ajuste de mnimos cuadrados de los datos a una curva exponencial del tipoY=axb.

Podemos llevar a cabo los clculos usando el mtodo matricial tal y como se hizo en los problemas anteriores, pero aprovecharemos la disponibilidad de una calculadora puesta a la disposicin de las comunidades acadmicas alrededor del mundo por el Profesor Victor Miguel Ponce de la San Diego State University para llevar a cabo un ajuste de datos a una curva exponencial de mnimos cuadrados precisamente de la forma Y=axb en la siguiente direccin:

http://ponce.sdsu.edu/onlineregression12.php

Usando la calculadora, obtenemos como frmula del "mejor ajuste": Y = 6.104X2.056

La grfica de los datos discretos originales superimpuesta sobre la curva exponencial generada por estos datos es la siguiente:

El ajuste parece ser un buen ajuste, con algunos puntos discretos situados ligeramente fuera de la curva.

Este problema es parecido al problema anterior excepto por una diferencia muy importante: en el problema anterior se hizo un ajuste a una frmula de la forma Y=abX, mientras que en este problema se hizo un ajuste a una frmula de la forma Y=aXb. Mientras que el modelo utilizado en

el problema anterior intersecta al eje vertical en un punto diferente de Y=0 para X=0, el modelo utilizado en este problema intersecta al eje vertical precisamente en Y=0 para X=0, lo cual puede ser importante en algunas aplicaciones fsicas en donde el crecimiento exponencial comienza precisamente a partir del "punto cero".

PROBLEMA: Despus de llevarse a cabo un experimento con sumo cuidado tratando de obtener los resultados ms precisos posibles, se obtuvieron los siguientes resultados: X1 = 1, Y1 = 1.81 X2 = 2, Y2 = 0.75 X3 = 3, Y3 = 0.33 X4 = 4, Y4 = 0.146 X5 = 5, Y5 = 0.118 X6 = 6, Y6 = 0.05 X7 = 7, Y7 = 0.037

Ajustar estos datos experimentales a un modelo del tipo Y=aXb. Qu tipo de experimento parecen estar sugiriendo los datos?

Podemos proceder tal y como lo hicimos en el problema anterior, en donde utilizamos el mismo modelo. Si hacemos esto, obtenemos la siguiente frmula: Y = 2.410X-2.02

La grfica de esta curva con los datos discretos que generaron la frmula puestos en la misma grfica nos muestra el siguiente aspecto:

El exponente negativo de 2.02 en la frmula parece tener un valor muy cercano al entero 2. Si suponemos que detrs de este nmero hay una ley natural, este nmero muy bien podra ser el nmero entero 2, lo cual tiene una repercusin inmediata, porque de acuerdo con el lgebra: X-2 = 1/X

El parmetro 2.410 parece ser una simple constante de proporcionalidad k para igualar las unidades en ambos lados de la frmula, dimensionndola en forma correcta. En este caso, la frmula se puede reescribir simblicamente como: Y = k (1/X)

Nos deben quedar pocas dudas de que el experimento se trat de un experimento de algo cuyo efecto est variando en razn inversa al cuadrado de otra cantidad , una cantidad que muy bien podra ser una distancia. Es muy posible que este experimento haya sido un experimento para verificar la variacin en razn inversa al cuadrado de la distancia predicha por la ley de la gravitacin universal de Sir Isaac Newton, o bien un experimento para verificar la variacin en razn inversa al cuadrado de la distancia de la fuerza de atraccin o repulsin entre dos cargas elctricas de signos opuestos o de signos iguales predicha por la ley de Coulomb. Se nos dice en el enunciado del problema que el experimento se llev a cabo con sumo cuidado, y an as varios datos

experimentales discretos cayeron visiblemente fuera de la curva que efectivamente parece ser la curva de "mejor ajuste", lo cual nos dice que el experimento se llev a cabo bajo circunstancias difciles que requirieron toda la habilidad que los investigadores pudieron desplegar en la realizacin del experimento.

PROBLEMA: Un fenmeno que se d con mucha frecuencia en la naturaleza es el fenmeno relacionado con el decaimiento exponencial (exponential decay) cuando la rapidez en la cada de cierta cantidad es directamente proporcional a la cantidad que va quedando. Para modelar un decaimiento exponencial, utilizamos una frmula como la siguiente: Y(X) = AB-CX

Suponiendo, para fines de simplificacin, que C=1, determinar los parmetros A y B que sean capaces de ajustar la frmula del decaimiento exponencial al siguiente conjunto de datos:

-- tabla_valores_decaimiento_exponencial.png --

La frmula

Y(X) = AB-X

es una frmula no-linear. Sin embargo, podemos linearizarla tomando logaritmos de ambos lados de la ecuacin: log[Y(X)] = log[AB-X]

log[Y(x)] = log(A) + log[B-X]

log[Y(X)] = log(A) -Xlog(B)

log[Y(X)] = log(A) - log(B)X

Haciendo P=log[Y(X)], Q=log(A) y R=log(B), tenemos una relacin linear sobre la cual se puede aplicar un ajuste de mnimos cuadrados con la ayuda del mtodo matricial. Montamos primero un vector de datos Y en el cual tomaremos el logaritmo de cada uno de los valores de Y: Y = [log(35)__log(23)__log(12.1)__log(8.2) ... log(1.19)__log(0.57)]

A continuacin, formamos la matriz de datos X. La primera columna deber contener puros unos, lo cual es representativo de cada uno de los valores de X elevado a la potencia cero. Y la segunda columna deber estar formada con el negativo de cada uno de los valores respectivos de X:

Con esto formado, podemos aplicar directamente la frmula matricial condensada que nos dar la vector solucin S: S = (XTX)-1 (XTY)

que resulta ser:

Es importante recordar que estos valores corresponden a la frmula linearizada sobre la cual se tomaron los logaritmos. Los valores de A y B son obtenidos tomando elantilogaritmo de los nmeros dados por la matriz solucin, lo cual equivale a elevar la base (10) a dichos nmeros como exponentes: A = 101.561 = 36.392

B = 100.441 = 2.761

La frmula ajustada con los datos numricos del experimento es entonces: Y(X) = 36.392(2.761)-X

La grfica de esta frmula con los datos discretos que la generaron superimpuestos sobre la misma es la siguiente:

Podemos ver que la frmula se ajusta razonablemente bien a los datos discretos con los cuales fue generada.

Si repasamos la frmula que obtuvimos, podemos ver que el parmetro B que es igual a 2.761 es un nmero que est muy cercano al nmero e=2.7182, el cual no slo es la base de los logaritmos naturales sino que tambin es un nmero que aparece en la solucin de muchas frmulas tericas (exactas) que vienen de la solucin de una ecuacin diferencial muy sencilla: dY/dx = -Y

Un ejemplo de esta clase de frmulas es la del decaimiento exponencial radioactivo, el fenmeno ms bsico de la fsica nuclear. La observacin de que el resultado que obtuvimos para el parmetro B est mucho muy cercano al nmero e nos debe hacer sospechar que en nuestro modelo el parmetro B es de hecho igual al nmero e. Esto nos puede llevar a refinar un poco ms nuestra frmula intentando llevar a cabo un ajuste de datos para el siguiente modelo: Y(X) = Ae-X

En este caso, el modelaje es mucho ms sencillo, ya que solo necesitamos procurar un solo parmetro en lugar de dos. Y en este caso, al llevar a cabo la linearizacin del modelo, podemos

tomar ventaja del hecho de que el nmero exponenciado es el nmero e utilizando logaritmos naturales en lugar de logaritmos base 10, con lo cual podemos obtener un ajuste ms cercano a la "realidad" predicha por un modelo terico exacto.