You are on page 1of 5

DESCRIPCIÓN DE ASIGNATURAS MAGÍSTER EN DATA

SCIENCE

Primer trimestre:

Data Driven Organization (3 créditos)


Este curso introduce a los alumnos a las llamadas data driven companies que centran su estrategia
de toma de decisiones en el uso de datos y Data Science. Mostrando cómo sus técnicas permiten
descubrir, enriquecer y responder a las preguntas que enfrentan tanto los tomadores de
decisiones como en los distintos niveles de la compañía en una variedad de industrias y
organizaciones. Los estudiantes explorarán cómo los individuos y las organizaciones evalúan las
opciones, toman decisiones, y cómo estas influyen las decisiones tácticas y estratégicas. El
curso incluirá charlas de invitados, lecturas de casos, discusiones para que los alumnos amplíen
su forma de ver las empresas y como la nueva economía de datos las impacta, aprender a realizar
las preguntas apropiadas, a interpretar los resultados y transmitir los hallazgos a distintas
audiencias. Se explorarán casos de áreas como el retail, banca, telecomunicaciones, energía,
salud y los medios de comunicación/entretenimiento

Python Para Análisis de Datos (4 créditos)


Este curso consiste en una introducción al lenguaje de programación Python. El curso
instruye en el lenguaje de programación poniendo especial énfasis en los módulos y
paquetes de Python para realizar análisis de datos. En este curso los alumnos también
aprenderán a usar otras herramientas básicas de Data Science como el uso de la línea de
comandos, notebooks de Jupyter y control de versiones con Git y GitHub.

Estadística para Data Science (3 créditos)


El objetivo de este curso es proporcionar a los estudiantes una introducción a métodos
de investigación cuantitativa y técnicas estadísticas para el análisis de datos. El contenido
se enseña con un enfoque práctico, orientado a usar métodos estadísticos para analizar
problemas de datos del mundo real. Entre las temáticas a cubrir se encuentran:
estadísticas descriptivas e inferenciales, muestreo, diseño experimental, pruebas
paramétricas y no paramétricas de diferencia, regresión de mínimos cuadrados
ordinarios y regresión logística.

1
Segundo Trimestre:

Análisis y Limpieza de Datos (3 créditos)


Este curso presentará los conceptos básicos de pre-procesamiento y análisis descriptivo
de datos. El objetivo principal es poder determinar cuáles datos son susceptibles de ser
convertidos en información para apoyar la toma de decisiones, y separar el ruido de la
señal. Es el primer paso en un proyecto de ciencia de datos. Los estudiantes aprenderán
a identificar las problemáticas que presentan los datos desde el momento de su registro
(por ej., error muestral, outliers), así como usar las herramientas necesarias para
describirlos (por ej., distribuciones e histogramas), explorarlos (por ej., agrupar o filtrar
bajo un criterio específico), y cruzarlos (por ej., utilizando otras fuentes). Asimismo, los
estudiantes comprenderán que las etapas de este proceso no son lineales, sino que se
benefician del diseño iterativo.

Machine Learning (4 créditos)


Este curso presentará herramientas de aprendizaje automático para generar valor a
partir de los datos. Estas herramientas incluyen modelos de clasificación y predicción de
fenómenos (por ej., RandomForest), descubrimiento de patrones de manera supervisada
(por ej., SVM, redes neuronales) y no supervisada (por ej., Hierarchical Clustering),
reducción dimensional, entre otros.

Visualización de la Información (3 créditos)


Este curso introduce una visión global y práctica de las temáticas, herramientas y técnicas
principales de Visualización de Información. Los estudiantes, primero, adquirirán
capacidades para realizar análisis visual exploratorio, con el fin de responder preguntas
de primer orden sobre los datos, y de generar preguntas de segundo orden sobre éstos.
Luego, adquirirán capacidades para convertirlos en información interpretable que apoye
la toma de decisiones a través de la comunicación visual. Finalmente se fomentará el
espíritu crítico, de modo que puedan interpretar, cuestionar, validar y mejorar la
comunicación de información por otras entidades.

2
Tercer Trimestre:

Machine Learning Avanzado (4 créditos)


En este curso se pondrá énfasis en los enfoques con relevancia práctica actual y
profundizará en técnicas avanzadas de Machine Learning, como sistemas de
recomendación, redes neuronales y Deep Learning. En este curso se pondrá especial
foco en cómo buscar, combinar y seleccionar los mejores modelos para el problema que
se desea resolver y en cómo determinar los factores o variables significativas que
están relacionadas con el evento que se desea predecir.

Almacenamiento y Captura de Datos (3 créditos)


El almacenamiento, la gestión y el procesamiento de los datos son fundamentales para
Data Science. Se explorarán las arquitecturas más tradicionales de almacenamiento y
procesamiento que sirven de primeros bloques para la construcción de los sistemas más
complejos que se requieren para grandes volúmenes de datos. El curso examinará los
modelos de bases de datos tradicionales, de data warehouses y de sistemas manejos de
datos no estructurados.

Ciencia de Redes (3 créditos)


Estamos rodeados de sistemas que son extremadamente complicados. Por ejemplo, la
sociedad que requiere de la cooperación entre miles de millones de personas o las
infraestructuras de comunicaciones que integran miles de millones de teléfonos
celulares con computadoras y satélites. Nuestra capacidad para razonar y comprender
nuestro mundo requiere la actividad coherente de miles de millones de neuronas en
nuestro cerebro. Estos sistemas se denominan sistemas complejos, los que tienen la
particularidad de que es imposible entender su comportamiento sólo a partir del estudio
de sus componentes. Dado el importante papel que juegan los sistemas complejos en
nuestra vida diaria, en la ciencia y en la economía, su comprensión, descripción
matemática, predicción y eventualmente control es uno de los mayores desafíos
intelectuales y científicos del siglo XXI. Esta asignatura ofrece una visión introductoria a
las temáticas, herramientas y técnicas fundamentales en el análisis de redes complejas.
Los estudiantes, primero, identificarán las distintas áreas de aplicación y luego,
desarrollarán capacidades para elegir y aplicar las herramientas y técnicas de la ciencia
de redes necesarias para la resolución de problemas.

3
Cuarto Trimestre:
Seguridad y Protección de Datos (3 créditos)
A medida que aumenta la cantidad de información recopilada, la seguridad de los datos
y los temas de privacidad son cada vez más centrales. Legisladores, empresas e
instituciones de todo tipo están bajo la presión de implementar procedimientos y
reglamentos de seguridad y privacidad bajo condiciones rápidamente cambiantes a
nivel tecnológico. Este curso examinará cuestiones de seguridad relacionadas con la
protección de información personal y corporativa sensible, preguntas políticas y sociales
sobre el valor de la seguridad y la privacidad, el equilibrio de intereses entre individuos,
gobierno y empresas; las leyes y regulaciones actuales de seguridad de la información y
privacidad; y tecnologías emergentes que pueden afectar la seguridad y la privacidad.

Big Data y Cloud Computing (4 créditos)


En este curso se presentarán técnicas para recolectar, almacenar y manejar grandes
volúmenes de información, a escalas de Facebook, Twitter. La cantidad de datos creados
y almacenados a nivel mundial crece día a día, y la capacidad de los computadores de
escritorio ya no es suficiente para almacenar (y mucho menos procesar en un tiempo
razonable) todo lo que se necesita analizar. En este contexto, el curso proveerá a los
estudiantes las herramientas necesarias para escalar su almacenamiento y manejo a
cantidades enormes de datos, a través de procesamiento en la nube (por ej., Microsoft
Azure), lenguajes y paradigmas para “Big Data” (por ej. a través de Hadoop y Pig).

Visión Computacional (3 créditos)


En este curso se introducirán los elementos de la visión computacional y su carácter
interdisciplinario y entregará un panorama general del uso e impacto de las
herramientas generadas por la visión computacional.
Se profundizará en las herramientas básicas que permiten manipular y procesar
imágenes, en orden de enseñar a los estudiantes a obtener información relevante a
partir de una imagen y utilizarla para resolver problemas de diversa índole.

4
Quinto Trimestre:

Desarrollo de Proyectos y Productos de Datos (3 créditos)


Los productos de datos son aplicaciones que utilizan modelos de Machine Learning y
datos para generar valor y a su vez generar más datos que permitan hacer inferencias o
predicciones. En este curso se estudiarán los proyectos basados en datos y Machine
Learning, como desarrollar una aplicación basada en datos y su ciclo de vida. El curso se
basará en clases teóricas como prácticas en las que se mostrarán herramientas para la
creación de productos de datos.

Análisis de Big Data (4 créditos)


Este curso se focaliza en cómo modificar las técnicas de análisis, procesamiento de datos,
y Machine Learning para que estas puedan escalar y funcionar con grandes volúmenes
de datos, tanto estructurados como no estructurados, para generar modelos sofisticados
utilizados para realizar predicciones en tiempo real. Se verán conceptos de computación
paralela, data frames, diseño de algoritmos usando herramientas como Hadoop, Spark y
MLlib entre otras.

Procesamiento de Lenguaje Natural (3 créditos)


Este curso presentará varios de los aspectos centrales del Procesamiento de Lenguaje
Natural. Los estudiantes aprenderán a trabajar con texto partiendo por los aspectos más
básicos (listas y funciones hasta expresiones regulares), clasificar y describir texto
(tokenizar, lematizar, etc y estadísticas descriptivas), y generar modelos de tópicos
semánticos de un corpus de documentos (usando LDA y STM). Se espera que el
estudiante genere una base sólida en estas materias, para así tenerlas de herramientas
a la hora de testear una hipótesis en donde los métodos para testearlas sea preciso
trabajar con lenguaje natural expresado en texto.

Sexto Trimestre:

Capstone Project (10 créditos)


En este curso los estudiantes desarrollarán y ejecutarán un proyecto que involucra datos
del mundo real. Los proyectos incluirán: formulación de una pregunta para ser
respondida por los datos; recopilación, limpieza y procesamiento de datos; elegir y
aplicar un modelo y / o método analítico adecuado al problema; y comunicar los
resultados a una audiencia no técnica.

You might also like