You are on page 1of 3
UNIVERSIDAD NACIONAL DE INGENIERIA. FACULTAD DE INGENIERIA MECANICA. Escuela Profesional de Ingenieria Mecatrénica UNI Machine Learning (MT-616-A) Paul Cardenas Lizana Practica No 1 (Seccién A) Pregunta 1: (5 puntos) Google obtiene un modelo de machine learning que predice el numero de personas (p) que compran sus celulares pixeles mundialmente y el costo (c) futuro del celular usando su data, Los modelos de ML son p(t) = po pit + pat? +...+ Pat” Y elt) = Co + Ct + Ot? +...+ Ct" donde t estd dado en afios. Google desea saber la ganancia total que obtendré este afio por la venta de su equipo Pixel 7 que saldré al mercado este aio durante un periodo de 12 meses. La ganancia puede ¢ ser predecida usando la integral del producto de los regresores G = f(t) p(t) dt. Para implementar el 0 cédigo se necesita una matriz U para expresar la integral en forma de multiplicacién de matrices de la forma G = c’U p donde U es una matriz numérica de nxn. Calcular U. Pregunta 2: (3 puntos) La regularizacién es una forma esténdar de controlar el sobreajuste en el aprendizaje supervisado. La forma comin de una funcién de costo penalizada con una regularizacién “J(0) = S32 | + As — ysl? + AOA i La regularizacién no solo trata de encontrar exclusivamente los valores de @ que minimicen la discrepancia entre x, y y, Sino que también intenta satisfacer un requisito en el que @ no debe ser muy grande. De esta manera se controla directamente la competencia entre la magnitud de @ y el pardmetro A. En este problema vamos regularizar la regresién lineal con un término cuadrético (q=2) que se pueden escribir de la forma matricial como J(0) 5(x0 —y)"(X0-y)+0"V0 a. Calcular el valor de @ que minimice la funcién de costo Pregunta 3: (4 puntos) Uno de los objetivos de MT-616 es prepararte para aplicar algoritmos de ML a problemas reales y estar preparado para comenzar a trabajar con ML o en la investigacién en inteligencia artificial. El exam 04 serd el proyecto final del curso que esté orientado en esta direccién. Muchos proyectos interesantes provienen de aplicaciones de interés o de enfocarse en un subcampo de ML de forma especifica y que se desea explorar més. Los temas del proyecto pueden variar pero en lineas generales se pueden clasificar en los 2 siguientes ejes Proyecto de aplicacién: donde se elige una aplicacién de interés y se explora la mejor manera de aplicar algoritmos de ML para poder resolverlo. UNIVERSIDAD NACIONAL DE INGENIERIA FACULTAD DE INGENIERIA MECANICA Escuela Profesional de Ingenieria Mecatrénica © Proyecto algoritmico: donde se elige un problema o una familia de problemas y se desarrolla un algoritmo nuevo de ML o alguna variante nueva de algoritmos vistos en clase para poder resolverlo, En esta primera etapa debes identificar un problema y su dataset. Se recomienda que una vez identificado el tema de interés se debe buscar investigaciones existentes sobre temas relacionados en htto://scholargoogle.com, Otro punto importante es identificar uno o varios datasets adecuados disponibles publicamente para el proyecto. Un buen lugar donde comenzar a buscar es httos://archive.ics.uciedu/mi/index.php. Esto va ayudar a saber si los datos necesitan un preprocesamiento considerable para adaptarse al proyecto o si se necesita recopilar/generar datos nuevos para el problema. Entregable: El cédigo debe contener: a. Carga del dataset b. Realizar un EDA para determinar los atributos mas importantes. Pregunta 4: (8 puntos) Las Entidades Prestadoras de Salud son empresas que brindan servicios de salud privada a los trabajadores que estén afiliados a ellas y complementan la cobertura que brinda EsSalud. Dichas empresas de seguros de salud sélo pueden ganar dinero si recaudan més de lo que gastan en la atencién médica de sus beneficiarios y la logistica que esta conlleva. En realidad saber con mucha exactitud cudnto se va gastar en un paciente es un problema muy complejo incluso sabiendo que solo algunas enfermedades y tratamientos son muy frecuentes en ciertos segmentos de la poblacién peruana. En ese sentido, los costos médicos son dificiles de predecir ya que la mayor parte del dinero gastado se va en enfermedades no convencionales de los pacientes. Pacificos EPS te ha contratado como ingeniero de machine learning con el objetivo de desarrollar un modelo de ML que es capaz de predecir con alta precisién los costos del seguro en fun n de los datos de las personas dadas en el dataset. Ademés, debes determinar cual de las variables es la mas importante e influye en los costos del seguro. Es importante desarrollar un modelo de ML adecuado porque este va servir para crear tablas de mortalidad para determinar si se debe subir o bajar el precio de las primas anuales de acuerdo con los costos de tratamiento predecidos. EI dataset contiene informacién médica y los costos facturados por Pacificos EPS de més de 1000 asegurados con los siguientes atributos © Edad: edad del beneficiario principal © Sexo: sexo del contratista de seguros, mujer, hombre © IMC: indice de masa corporal (IMC) es un valor derivado de la masa y la altura de una persona. EI IMC se define como la masa corporal dividida por el cuadrado de la altura corporal y se expresa en unidades de kg/m? Hijos: Nimero de dependientes cubiertos por el seguro. Fuma: Si/No Regi Costo: Costos médicos individuales facturados por el seguro. el drea residencial del beneficiario. UNIVERSIDAD NACIONAL DE INGENIERIA FACULTAD DE INGENIERIA MECANICA Escuela Profesional de Ingenieria Mecatrénica Entregable: El cédigo debe contener: a Carga de set de datos y divisién del set en datos de training y test. Realizar un andlisis de jerarquias en los datos para subdividirlos. Realizar un EDA para determinar los atributos mas importantes. Construccién de un modelo de ML sin/con regularizacién Graficar E, VS Eq. para encontrar el valor éptimo del modelo deseado. EI R debe ser mayor que 0.95 en los datos de test para el modelo final. Reportar el error MSE del modelo final. Reference: https://github.com/PCL-Al/MT616_2019_1/blob/master/Lab03/Lab03.ipynb https://github.com/PCL-AV/MT616 2018 2/blob/master/Lab01/Lab01a_MT616.ipynb

You might also like