You are on page 1of 5

UNIVERSIDAD DE CUENCA

Facultad de Ingeniería

Trabajo de Investigación

Realizado por:

Stalin Miguel Yandun Arichavala

Materia:

Lab-Física (Fluidos, acústica y calor)

Paralelo:

Grupo 10

Cuenca-Octubre 2018
Regresión lineal.
La regresión lineal permite determinar el grado de dependencia de
las series de valores X e Y, prediciendo el valor y estimado que se
obtendría para un valor x que no esté en la distribución.
Tipos de modelos de regresión lineal
Existen diferentes tipos de regresión lineal que se clasifican de
acuerdo a sus parámetros:
Regresión lineal simple
La regresión lineal simple se basa en estudiar los cambios en una
variable, no aleatoria, afectan a una variable aleatoria, en el caso de
existir una relación funcional entre ambas variables que puede ser
establecida por una expresión lineal, es decir, su representación
gráfica es una línea recta. Es decir, se está en presencia de una
regresión lineal simple cuando una variable independiente ejerce
influencia sobre otra variable dependiente.
Ejemplo: Y = f(x)
Regresión lineal múltiple
La regresión lineal permite trabajar con una variable a nivel de
intervalo o razón, así también se puede comprender la relación de
dos o más variables y permitirá relacionar mediante ecuaciones, una
variable en relación a otras variables llamándose Regresión múltiple.
O sea, la regresión lineal múltiple es cuando dos o más variables
independientes influyen sobre una variable dependiente.
Ejemplo: Y = f(x, w, z).
Aplicaciones de la regresión lineal
Líneas de tendencia
Una línea de tendencia representa una tendencia en una serie de
datos obtenidos a través de un largo período. Este tipo de líneas
puede decir si un conjunto de datos en particular (como por ejemplo,
el PBI, el precio del petróleo o el valor de las acciones) han
aumentado o decrementado en un determinado período. Las líneas
de tendencia son generalmente líneas rectas, aunque algunas
variaciones utilizan polinomios de mayor grado dependiendo de la
curvatura deseada en la línea.
Medicina
En Medicina, las primeras evidencias relacionando la mortalidad con
el fumar tabaco vinieron de estudios que utilizaban la regresión lineal.
Los investigadores incluyen una gran cantidad de variables en su
análisis de regresión en un esfuerzo por eliminar factores que
pudieran producir correlaciones espurias.
En el caso del Tabaquismo, los investigadores incluyeron el estado
socio-económico para asegurarse que los efectos de mortalidad por
tabaquismo no sean un efecto de su educación o posición
económica. No obstante, es imposible incluir todas las variables
posibles en un estudio de regresión.
En el ejemplo del tabaquismo, un hipotético gen podría aumentar
la Mortalidad y aumentar la propensión a adquirir enfermedades
relacionadas con el consumo de tabaco.
Industria
En la industria tiene aplicación para investigar la relación entre el
rendimiento de la producción y uno o más factores del (o de los) que
depende, como la Temperatura, la humedad ambiental, la presión, la
cantidad de insumos, etc.; con base en este análisis se puede
pronosticar el comportamiento de una variable que se desea estimar.
Ejemplo de regresión lineal
Con base a los datos de la tabla expuesta a continuación identificar
la relación entre el costo en dólares (Y) y los días de instancia
hospitalarios (X).
X=variable independiente
Y=variable dependiente
X Y
nº Días de Estanca Costo(miles de dólares)
1 15 2.600
2 14 2.580
3 16 2.600
4 14 2.595
5 15 2.630
6 18 2.700
7 16 2.695
8 18 2.700
9 19 2.780
10 16 2.695
11 17 2.720
12 18 2.750
13 17 2730

Costo(miles de dolares)
y = 36.522x + 2076.6
2,800

2,750

2,700

2,650

2,600

2,550
14 15 16 17 18 19 20

Para el modelo se plantea las siguientes hipótesis:


 Hipótesis nula: El aumento de días de instancia de un paciente
en hospitalización, no incrementa el costo (en dólares) a pagar.
 Hipótesis alternativa: El aumento de días de instancia de un
paciente en hospitalización, incrementa el costo (en dólares) a
pagar.
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,88900
Coeficiente de determinación R^2 0,79033
R^2 ajustado 0,77127
Error típico 31,61877
Observaciones 13,00000

ANÁLISIS DE
VARIANZA
Grados de Suma de Promedio de F Valor crítico
libertad cuadrados los de F
cuadrados
Regresión 1,00000 41452,78465 41452,78465 41,46328 0,00005
Residuos 11,00000 10997,21535 999,74685
Total 12,00000 52450,00000

Coeficientes Error Estadístico Probabilidad Inferior


típico t 95%
Intercepción 2076,59653 93,34420 22,24666 0,00000 1871,14733
Días de 36,52228 5,67187 6,43920 0,00005 24,03858
Estanca
Superior Inferior Superior
95% 95,0% 95,0%
2282,04574 1871,14733 2282,04574
49,00597 24,03858 49,00597

Al visualizar el coeficiente de correlación múltiple es 0.88900 que nos


indica que existe una alta asociación con las variables el costo en
dólares (Y) y los días de instancia de un paciente (X). También es
importante analizar el coeficiente de determinación que da 0.79033 o
un 79%, este valor nos indica que los cambios ocurridos en los costos
de hospitalización son explicados por el número de instancias, nos
determina con un 79% que las dos variables se encuentran muy bien
asociadas.
Al analizar el valor crítico de F que es igual a 0.00005 al ser un valor
tan pequeño podemos rechazar la hipótesis nula y concluimos
afirmando la hipótesis alternativa: El aumento de días de instancia de
un paciente en hospitalización, incrementa el costo (en dólares) a
pagar.

You might also like