You are on page 1of 21

2.

1 Campos de la Ciencia de Datos


2.1.1 Cómputo y Algoritmos
2.1.2 Dominio del Negocio
2.1.3 Estadística
2.1.4 La conjunción de las Áreas
2. Campos y 2.2 Recursos y Herramientas de la Ciencia de Datos

recursos 2.2.1 Recolección de Datos


2.2.2 Análisis de datos exploratorio
2.2.3 Inferencia Estadística
2.2.4 Aplicaciones del Aprendizaje de Máquina
2.2.5 Ingeniería de Datos
2.2.6 Inteligencia de Decisiones

1
Inicios

• En 1996 el término ‘Ciencia de Datos’ fue utilizado por primera vez en


una conferencia llamada "Ciencia de datos, clasificación y métodos
relacionados", que tuvo lugar en una reunión de miembros de la
‘International Federation of Classification Societies’ (IFCS) con sede en
Kobe, Japón
• En 1997, C.F. Jeff Wu dio una charla llamada "Statistics = Data
Science?", donde describió al trabajo estadístico como una trilogía
conformada por recolección de datos, análisis y modelado de datos, y
la toma de decisiones, haciendo la petición de que la estadística fuese
renombrada como ciencia de datos, y los estadísticos como científicos
de datos

2
Definición

• Wikipedia, “La ciencia de datos es un campo


interdisciplinario que involucra métodos
científicos, procesos y sistemas para extraer
conocimiento o un mejor entendimiento de
datos en sus diferentes formas, ya sea
estructurados o no estructurados,​ lo cual es una
continuación de algunos campos de análisis de
datos como la estadística, la minería de datos, el
aprendizaje automático, y la analítica
predictiva.”

• https://medium.com/datos-y-
ciencia/qu%C3%A9-diablos-es-ciencia-de-datos-
f1c8c7add107
3
• AI concepts https://vimeo.com/471205901
Interrelación entre • AI introduction https://vimeo.com/471206096
áreas de estudio • AI importance https://vimeo.com/471206066
4
5
Científico de Datos
• El doctor en estadística Nathan Yau, precisó
lo siguiente: “el científico de datos es un
estadístico que debería aprender interfaces de
programación de aplicaciones (API), bases de
datos y extracción de datos; es un diseñador
que deberá aprender a programar; y es un
computólogo que deberá saber analizar y
encontrar datos con significado”

6
¿Qué es un científico de datos?
• Como especialidad, la ciencia de datos aún es nueva. Surgió de
los campos del análisis estadístico y de la minería de datos.
• The Data Science Journal se lanzó inicialmente en 2002 y su
publicación corrió a cargo del International Council for
Science: Committee on Data for Science and Technology.
• En 2008 surgió el nombre de científico de datos y este campo
prosperó rápidamente. Desde entonces, ha habido una escasez
de científicos de datos, a pesar de que cada vez más colegios y
universidades han comenzado a ofrecer grados en ciencia de
datos.
• Data Scientist, Data Engineer & Other Data Careers, Explained
¿Qué hace un científico de datos?

• Las tareas de un científico de datos pueden incluir el desarrollo de estrategias


para analizar datos, la preparación de datos para su análisis, explorar, analizar y
visualizar datos, construir modelos con datos mediante el uso de lenguajes de
programación como Python y R y desplegar modelos en aplicaciones.
• El científico de datos no trabaja solo. De hecho, la CD más efectiva se ejecuta en
equipos.
• Además de un científico de datos, este equipo puede incluir un analista
empresarial que define el problema, un ingeniero de datos que prepara los
datos y su método de acceso, un arquitecto de TI que supervisa los procesos
subyacentes y la infraestructura, y un desarrollador de aplicaciones que
implementa los modelos o las salidas del análisis en aplicaciones y
productos
8
• Advice carrer in DS https://vimeo.com/500529102
• Advice new DS https://vimeo.com/498567033
Habilidades requeridas • Recruiting for DS https://vimeo.com/498566828
• Qué son las "habilidades blandas" y por qué cada vez más
compañías se fijan en ellas al contratar

9
Salarios
Las profesiones con mayor demanda y mayores
ingresos son:
•Chief Digital Officer (US$160.000 anuales)
•Specialist & Virtual Reality Officer (US$120.000 anuales)
•Científicos de Datos (US$120.000 anuales)
•Performance Manager (US$112.000 anuales)
•Chief Marketing Officer (US$100.000 anuales)
•Big Data Project Manager (US$100.000 anuales)
•Enterprise Resource Planning (US$90.000 anuales)
•Trade Marketing Manager (US$78.000 anuales)
•Key Account Manager (US$78.000 anuales)
•Architecture Manager of Salesforce (US$70.000 anuales)

https://mba.americaeconomia.com/articulos/notas/mexico-alta-demanda-eleva-hasta-20-los-sueldos-de-los-trabajos-digitales

10
https://www
.secureweek
.com/estado
-de-la-
inteligencia-
artificial-y-
el-
aprendizaje-
automatico-
en-2019/
11
RoadMap

12
Referencias

• https://www.kdnuggets.com/
• https://www.kaggle.com/
• https://www.datasciencecentral.com/
• https://www.packtpub.com/free-learning
• https://medium.com
• https://tec-ps.com/5-libros-data-scientist-leer/
• Oracle IA https://vimeo.com/594766793
• Oracle IA y ML https://vimeo.com/590388511
• NETEC introducción CD
https://vimeo.com/473707856
• Congnitive Computation
https://vimeo.com/471205947
• Jeopardy https://vimeo.com/471206012

13
Expectativa vs realidad

• https://twitter.com/drangshu
14
El proceso
de la Ciencia
de Datos

•Creating Your First Data Science Project — Data Scientist


Perspective
•How To Start Your First Data Science Project
15
El primer paso consiste en
establecer un objetivo de
investigación.
• El propósito principal aquí es asegurarse de
que todos los interesados comprendan el qué,
cómo y por qué del proyecto.
• Siempre debemos tener bien en claro cuál es la
pregunta que queremos responder con la
ayuda de los datos.

16
2. El segundo paso • Los datos deben estar disponibles para poder ser analizados.
• Este paso incluye encontrar los datos adecuados y obtener
consiste en la obtención acceso a los mismos.
de los datos • El resultado de esta etapa suelen ser los datos en su forma
cruda, que probablemente necesitarán ser pulidos y
transformados antes de que puedan ser utilizados

17
3. El siguiente paso es prepararlos.

• Esto incluye la transformación


de los datos de una forma cruda
a una forma en la que puedan
ser utilizados directamente en
los modelos.
• Para poder lograr esto, debemos
detectar y corregir diferentes
tipos de errores en los datos,
combinar datos de diferentes
fuentes y transformarlos.
• Una vez completado este paso,
podemos avanzar hacia la
visualización de datos y el
modelado.

18
• El objetivo de este etapa es
4. El cuarto obtener una comprensión
profunda de los datos.
paso es la • Buscaremos patrones,
correlaciones y desvíos
exploración basados en técnicas
visuales y descriptivas.
de datos. • Los conocimientos
adquiridos en esta fase nos
permitirán comenzar con el
armado del modelo.

19
5. Construcción de modelos.

• En esta etapa intentamos obtener los


conocimiento o hacer las predicciones de
acuerdo a los lineamientos establecidos en la
primer etapa.
• Aquí podemos utilizar todas las técnicas y
herramientas que nos proporciona el Machine
Learning.
• El objetivo es obtener el modelo o la
combinación de modelos que mejor resultados
nos proporcionan.
• The 10 Algorithms Machine Learning Engineers
Need to Know

20
• Un buen modelo no sirve de nada si no es utilizado para
6. Presentación mejorar la eficiencia y obtener mejores resultados.
de los resultados • En esta última etapa debemos presentarle los resultados
y automatizar del análisis a las personas responsables de tomar las
análisis. decisiones en las organizaciones para que los modelos
puedan ser adoptados.
21

You might also like