Professional Documents
Culture Documents
Unidad 4a
Unidad 4a
Unidad 4
Temas
● Estadística inferencial
● Modelos determinísticos y estocásticos
● Tipos de modelos
● Machine Learning
● Otras técnicas
● Caso práctico de modelado.
¿Para qué sirve
la estadística?
La estadística es una rama de las matemáticas que se utiliza para recopilar, analizar e interpretar datos con
el fin de tomar decisiones informadas basadas en la evidencia obtenida.
En nuestros datos muestrales detectamos patrones que nos sirven para predecir qué
sucederá en la población.
¿Qué es un modelo en estadística?
Un modelo es una representación matemática o simbólica que se utiliza para describir o explicar el
comportamiento de un conjunto de datos o de una población en general.
Un modelo matemático relaciona una variable que queremos predecir con una o varias variables
relacionadas.
Algunos ejemplos..
Respuesta Predictora
Explicada Explicativa
Target Features
Un modelo matemático nunca es una
representación completamente exacta de una
situación física.
En un buen modelo la realidad se simplifica lo
suficiente para permitir cálculos matemáticos, pero
incluso así es bastante exacto para permitir
conclusiones valiosas.
Es importante el conocimiento acerca de las
limitaciones de un modelo.
Modelos determinísticos y estocásticos
● Un modelo determinístico es aquel que describe una relación fija y precisa entre las variables.
● Los modelos paramétricos suponen una distribución específica de probabilidad para los datos y estiman los
parámetros de esa distribución. Ejemplo: regresión lineal
● Los modelos no paramétricos no hacen suposiciones explícitas sobre la distribución de probabilidad y se basan en
métodos más generales. Ejemplo: modelo de ml
Machine Learning
Aprendizaje automático
Rama de la Inteligencia Artificial (AI) que desarrolla y aplica algoritmos que pueden aprender de los datos,
identificando los patrones, y generar predicciones sin ser programados explícitamente.
Inteligencia
Disciplina que incluye diversas técnicas y enfoques
Artificial para desarrollar sistemas informáticos capaces de
realizar tareas que requieren inteligencia
Un algoritmo es una secuencia finita de instrucciones bien definidas para resolver una clase de
problemas específicos o un cálculo.
Video “Instrucciones Exactas”
https://www.youtube.com/watch?v=ajkglMnByFM
En la programación habitual, escribimos algoritmos para que una computadora siga, con el fin de realizar una tarea específica.
En los modelos de ML, en lugar de decirle a la computadora cómo realizar una tarea específica, el algoritmo se utiliza para
entrenar un modelo a partir de los datos.
Los modelos de machine learning se construyen
utilizando algoritmos que aprenden de los
datos.
● Los modelos supervisados son aquellos que se entrenan utilizando un conjunto de datos etiquetados.
● El modelo es entrenado utilizando ejemplos. El modelo recibe un conjunto de datos de entrada junto con los
resultados correctos.
● El algoritmo mejora al buscar reducir el error entre los resultados reales y predichos.
Aprendizaje No Supervisado
desconocido
estado/ recompensa
● Metaheurísticas: Las metaheurísticas son técnicas de optimización que buscan
encontrar soluciones óptimas a problemas complejos. Estas técnicas se basan en la
exploración del espacio de soluciones del problema y en la aplicación de operaciones
heurísticas para guiar la búsqueda hacia una solución óptima.
● Algoritmos Genéticos: Los algoritmos genéticos son una técnica de optimización que
se basa en la selección natural. Estos algoritmos se inspiran en la evolución biológica y
utilizan operadores genéticos para generar nuevas soluciones y seleccionar las mejores
soluciones.
● Sistemas expertos: Los sistemas expertos son sistemas computacionales que utilizan
conocimientos de expertos en un dominio para realizar tareas específicas. Estos
sistemas utilizan reglas y algoritmos de inferencia para tomar decisiones basadas en el
conocimiento experto.
● Nociones de lógica difusa: La lógica difusa es una técnica de modelado matemático
que permite tratar la incertidumbre y la imprecisión en los datos. Esta técnica se basa en
la idea de que los conceptos no son binarios (verdadero/falso), sino que tienen un grado
de verdad difuso.
Actividad
¿Cómo funciona?
1
- ¿Qué datos se utilizan?
- ¿Qué tipo de algoritmo se usa? https://quickdraw.withgoogle.com/
- ¿Cómo se evalúa el éxito en el juego?
2 3
https://freddiemeter.withyoutube.com/ https://shadowart.withgoogle.com/
Pipeline de un proyecto
de Machine Learning
1 2 3
Definir el objetivo Obtener los datos Limpieza de los datos
4 5 6
Entrenar el modelo Evaluar y validar Deployment del modelo
el modelo
1 2 3 4 5 6
Definir el Obtener Limpieza de Entrenar el Evaluar y validar
Deployment
objetivo los datos los datos modelo el modelo
1 Definir el objetivo
● Abundantes
● Consistentes y confiables
● Estar disponibles
● Correctos
● Representativos
1 2 3 4 5 6
Definir el Obtener Limpieza de Entrenar el Evaluar y validar
Deployment
objetivo los datos los datos modelo el modelo
4 Entrenar el modelo
La selección del algoritmo dependerá de Cuando comparamos un enfoque tradicional con uno de ML, vale la pena
nuestro problema. Es conveniente recordar preguntarnos:
que siempre vamos a buscar la solución
más sencilla y económica. ● Calidad: ¿Cuánto mejor es la solución con ML?
a b c
1 2 3 4 5 6
Definir el Obtener Limpieza de Entrenar el Evaluar y validar
Deployment
objetivo los datos los datos modelo el modelo
Underfitting Overfitting
¿Cómo podemos
prevenir el Underfitting?
¿Cómo podemos
prevenir el overfitting?
Validación cruzada
(Cross-Validation)
https://teachablemachine.withgoogle.com/