You are on page 1of 33

INTRODUCCIÓN A LA CIENCIA DE DATOS

Unidad 1
Temas

● Perspectiva histórica
● Definición de DATO
● Tipos de Datos: datos estructurados, semi-estructurados, no estructurados
● Alcance de la Ciencia de Datos. Ciencias Asociadas.
● Aplicaciones en la Industria y en otras Ciencias.
?
¿Cuál es el % de argentinxs
que usan Redes Sociales?
Fuente: https://datareportal.com/reports/digital-2023-argentina
?
¿Cuántas horas al día usamos internet?
Fuente: https://datareportal.com/reports/digital-2023-argentina
Revolución Digital
Estamos atravesando una revolución digital basada en:

● Avances en tecnología:
● Cambios en cultura:
- Invención de dispositivos digitales
- Cambio en las expectativas y comportamientos de los
- Desarrollo de software y redes de comunicación
usuarios
- Necesidad de acceso instantáneo a información y
● Cambios en economía:
entretenimiento en línea
- Creciente demanda de productos y servicios digitales
- Nuevas formas de comunicación y participación en la
- Innovación y competencia entre empresas
sociedad
- Globalización y digitalización de la economía
Sociedad informacional
“(...) organización social en la que la generación, el
procesamiento y la transmisión de información se
Capitalismo globalizado + convierten en las fuentes fundamentales de la
sociedad mediatizada productividad y el poder, debido a las nuevas condiciones
tecnológicas que surgen en este período histórico".
(otrización de la significancia) >> experiencias
monoculturales (Castells M. La Era de la Información: Economía, Sociedad y Cultura: La
sociedad Red. 1999)
4ta Revolución Industrial ● Término masificado a partir del
Foro Económico Mundial 2016
● Se basa en sistemas
ciberfísicos, que combinan
infraestructura física con
software, sensores,
nanotecnología, tecnología
digital de comunicaciones
● Automatización e Intercambio
de datos

1760-1830 1850 sXX


Datificación de la vida
- La representación de la vida social a través de un conjunto de datos computarizados
- Intensificación del ejercicio de la captura, codificación y análisis de los datos producidos
por las personas >> producción de formas de experiencia social
?
¿Qué es un dato?
¿Qué es un dato?

Un dato es una representación simbólica (numérica, alfabética, algorítmica, espacial,


etc.) de un atributo.

Cualidad o característica propia de una


persona o una cosa
¿Es un dato…?

20

PERRO
Una imagen se puede
describir como un
conjunto de píxeles,
cada uno de los cuales
tiene un valor que
representa un atributo
visual específico
?
¿Qué tipo de
datos existen?
Tipos de Datos

Datos estructurados: tienen un formato Datos no estructurados: no tienen estructura Datos semi estructurados: no tienen una
estandarizado, tienen una estructura bien interna identificable. No están sujetos a estructura definida, pero sí tienen cierto grado
definida, cumplen con un modelo de datos, esquemas o modelos de datos predefinidos. de estructura. Pueden presentar etiquetas o
siguen un orden persistente. marcadores que indican cómo se deben
Por ejemplo:
organizar los datos.
Por ejemplo: ● Los archivos de imágenes
● Tabla ● Los archivos de audio Por ejemplo:
● Hoja de Excel ● Los PDF ● Archivos JSON, que tienen una
● Bases de datos relacionales o SQL estructura definida aunque no están
organizados en tablas
?
¿Contar con datos
es lo mismo que tener
información?
?
¿Información
es lo mismo que
conocimiento?
Información Conocimiento

La información es un conjunto de datos procesados o Conjunto de representaciones entretejidas basadas


datos que se le ha dado sentido por medio de una en información, con análisis, interpretación y
relación. La información es una combinación de argumentación, de un determinado contexto con
datos y significado. Representa el cuál, el quién, el significación y consciencia de sus interrelaciones.
cuándo y el dónde. Representa el cómo. Capacidad de utilizar la
información de manera efectiva.
Sabiduría

La sabiduría es entendida como una


abstracción significativa, basada en
procedimiento y en experiencia. La sabiduría
permite la acción racional y la utilización de
la experiencia. La sabiduría requiere un
mayor nivel de comprensión de los datos, la
información y el conocimiento. Representa
el por qué.

Proceso de Transformación de los Datos en Conocimiento

Fuente: https://www.revistaespacios.com/a15v36n10/153610E2.html
El dato

La información

El conocimiento

La sabiduría
Modelo Data Driven

Toma de decisiones estratégicas basadas en el análisis de los datos de la empresa.


4to Paradigma Científico
● Empírica = descripción de fenómenos naturales
● Teórica = usa modelos, hace generalizaciones
● Computacional = Simulación de problemas complejos
● e-Science = Unificación de teorías, experimentos y simulaciones

Cada vez hay más métodos para recolectar datos y ya no alcanzan las planillas de cálculo para Microsoft Research
interpretar la cantidad de datos recolectados.
?
¿Qué es la
Ciencia de Datos?
¿Qué es la ciencia de datos?

Campo de estudio interdisciplinario que utiliza métodos, procesos, algoritmos y


sistemas científicos para extraer información y generar conocimiento de los datos.
¿A qué disciplinas científicas
se asocia la Ciencia de Datos?

● Matemática: proporciona los métodos para analizar los datos y extraer


información relevante. Modelización de los datos, así como para el
desarrollo de algoritmos y técnicas de análisis de datos.
● Informática e Ingeniería de sistemas: proporciona los medios para ● Ciencias Sociales
● Ciencias Naturales
almacenar, procesar y analizar grandes cantidades de datos, así como para ● Ciencias Empresariales
desarrollar sistemas de software y hardware. ● Ciencias Políticas
● Etc..
APLICACIONES EN LA
INDUSTRIA
Fabricación y producción: Para
Finanzas y banca: Para la evaluación
Marketing y publicidad: Para analizar optimizar los procesos de producción
de riesgos, la detección de fraudes y
los patrones de comportamiento de y mejorar la eficiencia. Los datos
el análisis de mercado. La información
los consumidores y las tendencias recopilados de sensores y dispositivos
se usa para tomar decisiones
del mercado. Sirve para crear de seguimiento se pueden utilizar para
informadas y mitigar los riesgos.
campañas publicitarias más efectivas y identificar cuellos de botella, mejorar la
personalizadas, lo que puede mejorar calidad del producto y predecir las
las tasas de conversión y las ventas necesidades futuras de producción.

Salud y bienestar: para mejorar la calidad


de la atención. También los datos
recopilados de los pacientes se pueden
Logística y cadena de suministro: Para optimizar la gestión de la cadena de utilizar para predecir el riesgo de
suministro, desde la planificación hasta la entrega. Los datos se utilizan para identificar enfermedades, prevenir enfermedades o
oportunidades de mejora, reducir costos y mejorar la eficiencia de la logística y la mejorar los resultados del tratamiento.
distribución.
Material Complementario
● La 4ta Revolución Industrial - World Economic Forum https://youtu.be/-OiaE6l8ysg
● Qué es la cuarta revolución industrial (y por qué debería preocuparnos) - BBC https://www.bbc.com/mundo/noticias-37631834

Para curiosear..
● Sociedad de la información / Sociedad del conocimiento.
http://www.ub.edu/prometheus21/articulos/obsciberprome/socinfsoccon.pdf
● The Fourth Paradigm: Data-Intensive Scientific Discovery. Microsoft
https://www.microsoft.com/en-us/research/publication/fourth-paradigm-data-intensive-scientific-discovery/?from=https://research.mi
crosoft.com/en-us/collaboration/fourthparadigm/&type=exact

You might also like