You are on page 1of 29

BIG DATA

Y PERIODISMO DE DATOS

ALICIA TAPIA
Profesora de “Documentación y gestión de fuentes de comunicación”

UNIR Universidad Internacional de la Rioja

2

UNIVERSIDAD INTERNACIONAL DE LA RIOJA
Paseo de la Castellana, 163. 8 pl. - Madrid  Tel. 91 5674391  http://www.unir.net

Anteriormente ha sido responsable del proyecto de investigación “Incidencia de las nuevas tecnologías en técnicas y procedimientos de trabajo y contenidos de los medios audiovisuales”. del que se han publicado diferentes artículos en revistas españolas y extranjeras con impacto en el JCR. y cuenta con la participación en expediciones de datos organizadas por el grupo español de la Open Knowledge Foundation (OKFN. Un año antes había participado en el proyecto de Normalización y Migración de las bases de datos documentales de Telemadrid al nuevo sistema. Este proyecto de investigación social pretende tomar conciencia y visibilidad de la peligrosidad hacia los peatones en las ciudades y las deficiencias en los trazados urbanos. Entre 1999 y 2008 fue responsable de Documentación de Informativos en Telemadrid. Complutense y Carlos III de Madrid. UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. Su actual línea de investigación gira en torno al Periodismo de Datos. con el proyecto de periodismo de datos “Puntos negros urbanos”.ÍNDICE DE CONTENIDOS Explicaremos y analizaremos cuatro puntos fundamentales para poder entender los conceptos de Big Data y Open Data. y la relación de ambas materias con los medios de comunicación mediante el Periodismo de Datos: BIG DATA Y OPEN DATA PERIODISMO DE DATOS EXPEDICIÓN POR EL BIG DATA Y OPEN DATA HERRAMIENTAS DE EXTRACCIÓN Y VISUALIZACIÓN 3 ACERCA DE LA AUTORA ALICIA TAPIA es profesora de la asignatura “Documentación y gestión de fuentes de comunicación en UNIR. Es doctora en Ciencias de la Información.unir. la Universidad Internacional de la Rioja. Fundación por el Conocimiento Abierto).Madrid  Tel. 163. 91 5674391  http://www. la Big Data y Open Data. momento en el que se iniciaron los cambios tecnológicos en la televisión autonómica con la implantación de los sistemas de videoservidores y edición no lineal. .net . 8 pl. licenciada en Periodismo y magister universitario por la Universidad Complutense de Madrid. Además ha impartido clase desde 1998 en las universidades Francisco de Vitoria.

Universidad Carlos III. Trabajo fin de Master en Investigación en Documentación. comunicar y calcular información. Facultad de Humanidades. Disponible en: http://es. Martin.000. llegando a 1.com/doc/111830154/La-relacion-del-Periodismo-de-Datos-con-Big-Data-y-Open-Data UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. Comunicación y Documentación. Para tener una idea aproximada. 1 de abril de 2011.000 billones de bytes2.scribd. Ciencia. López.U U. 2 Mariño. 44. 163. Priscila.2 de esta última medida.Madrid  Tel. pp. En 2010 la información alcanzaba y superaba la barrera del zettabyte.2 ZETTABYTE (1.2 Z B) ES LA CANTIDAD DE INFORMACIÓN QUE HABÍA EN TOTAL EN 2010 1 Hilbert. 60-65. . nº 6025. Ángeles. El último informe sobre el Universo Digital de la consultora internacional IDC de junio de 2011 destaca que toda la información digital del mundo se duplica cada dos años.net . En 2007 casi el 94% de toda la información estaba en formato digital.000. La capacidad tecnológica del mundo para almacenar. 1 UN PETABYTE (1 PB) TODA LA INFORMACIÓN QUE GOOGLE PROCESÓ EN UNA HORA EN 2010 1 UN EXABYTE (1 EB) MIL MILLONES DE COPI AS DE LA REVISTA THE ECONOMIST 1. 332. pág. 8 pl.unir. La relación del Periodismo de Datos con Big Data y Open Data. 2012.BIG DATA Y OPEN DATA La era digital inició su andadura en el año 2002 al ser el primer año donde la capacidad de almacenamiento digital superó la capacidad de almacenamiento analógica1. un zettabyte son 1. ESTIMACIÓN DE CUÁNTA INFORMACIÓN REPRESENTA UNA MEDIDA: UN BYTE (1 B) UN NÚMERO EN UN CÓDIGO INFORMÁTICO DOS KILOBYTES (2 KB) SON UNA PÁGINA DE SÓ LO TEXTO 4 CINCO MEGABYTES (5 MB) TODAS LAS OBRAS DE S HAKESPEARE ENTRE UNO Y DOS GIGA BYTES (1 Ó 2 GB) UNA PELÍCULA COMPRIMIDA DE DOS HORAS 1 TERABYTES (15 TB) TODOS LOS LIBROS CAT ALOGADOS DE LA BIBLI OTECA DEL CONGRESO DE EE. 91 5674391  http://www. vol.

De los datos al Big Data. LA REVOLUCIÓN DE INTERNET NOS CONECTÓ A LA WEB Y A TODO EL 3 PLANETA .com/seccion=1266&idioma=es_ES&id=2013062110130001& activo=6. en los contadores de la luz y el agua. variedad y velocidad5. Disponible en: http://www. pero la captura y análisis de estos datos es algo muy complejo. EN ESTA SEGUNDA DÉCADA DEL SIGLO XXI ESTAMOS ASISTIENDO AL SURGIMIENTO DE UNA NUEVA REVOLUCIÓN: LA DE LOS DATOS 4. 91 5674391  http://www. Telos – Cuadernos de Comunicación e Innovación. el tráfico de datos se duplicará para 2015 hasta llegar a los 4. Disponible en: http://sociedadinformacion. Según el Informe Global de la Nube (2010 – 2015) de Cisco.unir. Soraya. en los códigos de barras.0. 163. AHORA. VELOCIDAD FRECUENCIA DE LAS AC TUALIZACIONES DE EST AS BASES DE DATOS. piezas de contenido de Facebook. Los expertos hablan de las tres “V” de Big data: volumen. SilicomWeek. al hablar del paisaje de los datos.net 5 . VARIEDAD DIVERSOS TIPOS DE FUENTES DE DATOS. tuits y vídeos en YouTube. EL ANÁLISIS HA DE REALIZARSE PRÁCTICAMENTE EN TIE MPO REAL. como un IPhone. YA SEAN ESTRUCTURADOS O NO ESTRUCTURADOS. EN LA DÉCADA DE 1990. no palpable.Toda esta información es conocida como Big data y se encuentra guardada en una nube virtual. A PARTIR DE TERABYTES O PETABYTES. denominada cloud computing. en las tarjetas de crédito.es/knowledge-center/tendencias-2012-las-tres-v-de-big-data-17819 UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. dicen que nosotros somos Big Data. 8 pl.8 zettabytes. tiene más poder de computación del que tenía la NASA cuando llegó el primer hombre a la luna. nº 95. unos obtenidos a través de PDFs y otros mediante tablas Excel. Tendencias 2012: Las tres ‘V’ de Big Data. en los sensores de humedad.siliconweek.fundacion. Los datos están en todas partes. junio – septiembre de 2013. VOLUMEN GRANDES VOLÚMENES DE DATOS. LA ENTRADA EN EL NUE VO SIGLO NOS TRAJO L A REVOLUCIÓN DE LA W EB 2. Pablo. 14 de enero de 2012. en las antenas de telefonía.Madrid  Tel.do 4 Idem 5 Fernández. El estudio de los datos depende de programas informáticos capaces de procesar y relacionar datos no estructurados.telefonica. Los grandes datos ya no se encuentran sólo en manos de las empresas y administraciones. Es en Internet donde se produce el mayor volumen de información a través de emails. Pueden llegar al ciudadano. 3 Paniagua. búsquedas en Google. LA PERIODISTA SORAYA PANIAGUA DESTACA QUE EN LA DÉCADA DE 1980 LA REVOLUCIÓN INFORMÁTI CA PUSO EL PC A NUESTRO ALCANCE. Es por esta razón que muchos autores. . Un dispositivo inteligente.

2013. Sin restricciones de copyright. 2013. Datos abiertos en un formato abierto. Tim Berners-Lee10. lo que se ha denominado Linked Data.unir. Esta automatización proporciona la posibilidad de vincular los datos abiertos. Open Data tiene un ámbito global y no contempla el pago por el uso de los datos. Telos – Cuadernos de Comunicación e Innovación. mejorar procesos. 6 Junta de Castilla y León . denominada Linked Open Data. estándares y abiertos para ser reutilizados de forma automática7. La apertura de datos del sector público permite que cualquier persona u organización pueda construir sobre ellos una nueva idea que resulte en nuevos datos. inventor de la Web. de forma que pudieran conectarse el contenido de las páginas web con el objetivo de mejorar su búsqueda. término que se utiliza en informática en general para relacionar unos datos con otros9.ucm.php/CIYC/article/view/41718/39756 10 Director del consorcio que se ocupa de las tecnologías de la Web. .w3.es/web/jcyl/RISP/es/Plantilla66y33/1284162104384 7 Garriga Portolà. en aquel que es independiente de la plataforma (sistema operativo de nuestro PC. http://www. 18. ya sea Windows. conocimientos.Precisamente por el gran volumen de datos y su variedad existe una necesidad de generar bases de datos homogéneas. El periodismo de datos y la web semántica. patentes u otros mecanismos de control. El Frankenstein español del Open Data. 8 pl.org/TR/gov-data/ 9 Antón Bravo. adoptó este término para exponer una de las iniciativas más interesantes de la web semántica. enero – abril de 2013. dar valor añadido a los existentes o incluso crear nuevos servicios. con un catálogo en línea8. Disponible en: http://revistas. pp. acceso y reutilización.fundacion.telefonica. http://sociedadinformacion. nº 94. bien estructurados y en formatos conocidos que faciliten la reutilización 6 . vol.net .do 8 Disponible en: http://www. Universidad Complutense. 99-116. Cuadernos de Información y Comunicación – CIC.jcyl. Marc. 163.Madrid  Tel. Los datos deben publicarse en bruto (sin procesar). Mac o cualquier otro). Este concepto de reutilización automática de los datos es el que distingue la Open Data de la información disponible en una página web.com/DYC/TELOS/REVISTA/Dossier/DetalleArtculoTELOS _94TELOS_DOSSIER3/seccion=1266&idioma=es_ES&id=2013021317580001&activo=6. 91 5674391  http://www. W3C (World Wide Web Consortium o Consorcio W3) UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana.es/index.datosabiertos. en formatos que faciliten un análisis abierto. Adolfo. OPEN DATA Datos abiertos es una filosofía que persigue que determinados datos estén disponibles de forma libre a todo el mundo. 6 Un servicio de apertura de datos públicos es aquel que proporciona datos en formatos digitales.Portal de Datos Abiertos. Lo más conveniente reside en publicar los datos en bruto. La actualización de estos datos es trascendental de cara a la visualización y publicación de los mismos.

php/CIYC/article/view/41718/39756 UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. legibles por ordenadores. 99-116.org/wiki/CSV Utiliza estándares de la web. valores separados por comas. donde las columnas están separadas por comas -o punto y coma.wikipedia. Adolfo. vol. como por ejemplo un archivo PDF o una imagen escaneada. Universidad Complutense. No sólo deben ofrecer los datos para su reutilización.Madrid  Tel. 163. Disponible en: http://revistas. Datos estructurados legibles por ordenador y sin formato propietario. 2013. capaz de recuperar y manipular los datos almacenados en Resource Description Framework (RDF).net 7 . http://es. Los datos están disponibles como datos estructurados. Conseguir las cinco estrellas es un logro para cualquier institución que quiera avanzar en el mundo de Open Linked Data.es/index. . como RDF y SPARQL.unir. 91 5674391  http://www. csv.y las filas por salto de línea. se vinculan.En 2010 anunciaron un sistema de cumplimiento con Linked Data basado en cinco estrellas11: UNA ESTRELLA * DOS ESTRELLAS ** TRES ESTRELLAS *** CUATRO ESTRELLAS **** Los datos están disponibles en la red. si la coma es el separador decimal. Cuadernos de Información y Comunicación – CIC. 8 pl. dotándolos de contexto. 11 Antón Bravo. eso da la primera estrella.ucm. CINCO ESTRELLAS ***** Si además de lo anterior. aunque sean difíciles de manipular. SPARQL: lenguaje de consulta de bases de datos. RDF: modelo de datos para metadatos en la Web. 18. los datos se enlazan con otros. acrónimo de ‘comma separated values’. en cualquier formato y con licencia abierta. como en un archivo Excel. Se trata de un tipo de documento en formato abierto y muy sencillo que sirve para representar los datos en forma de tabla. Por ejemplo. El periodismo de datos y la web semántica. para identificar los datos. lo que permite que otras personas puedan enlazarlos. pp.

ofrece una tabla y un mapa con Catálogos de Datos en el mundo. el portal de Datos Abiertos del Ayuntamiento de Zaragoza y el Catálogo de Datos de Asturias son los dos únicos portales españoles con las cinco estrellas. Contar con tres estrellas quiere decir que cualquier persona e institución puede acceder a datos en formatos que permiten su manipulación. Como tercer requisito.Madrid  Tel. clasificados según el número de estrellas12. Terrassa.org/sandbox/catalog/faceted/ Idem UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. Galicia. Barcelona. ya que tienen que entregar sus datos bajo un estándar que permita intercambiar datos entre diferentes fuentes de datos. Castilla y León y País Vasco13. en software libre. La cuarta y quinta estrella ya son mucho más difíciles de obtener. En 2013.También deben entregarse de forma estructurada. La Fundación CTIC. Les siguen con cuatro estrellas los portales de Aragón. 8 12 13 Disponible en: http://datos. . Gijón. 163. Cataluña. 8 pl. deben estar en formatos no propietarios. Islas Baleares. Por ejemplo. no se pueden entregar los datos sólo en formatos de Excel porque obligan a un usuario que quiera leerlos a pagar por un software que los lea.unir. Castilla La Mancha.fundacionctic.net . dedicada al Open Data y que lidera la iniciativa mundial de eGoverment en W3C. 91 5674391  http://www.

PORTAL DE DATOS DE NACIONES UNIDAS http://data.worldbank. 91 5674391  http://www.net . informes y otros recursos.gov. DATOS ABIERTOS EN EL MUNDO PORTAL DE DATOS DEL BANCO MUNDIAL http://datacatalogs. Incluye a representantes de los gobiernos locales. 8 pl.unir.org Es un sistema de acceso a las bases de datos de la ONU. El catálogo de datos del Banco Mundial incluye bases de datos. · El usuario puede acceder a un gran número de bases de datos de las Naciones Unidas ya sea navegando por la serie de datos o a través de una búsqueda por palabra clave. · Los objetivos de UN Datos son facilitar el libre acceso a las estadísticas mundiales.uk La disposición de los gobiernos a entregar o abrir sus datos varía de país en país. organizaciones internacionales como el Banco Mundial y numerosas organizaciones no gubernamentales. .A continuación se presentan algunos portales internacionales y nacionales relevantes: FUENTES OFICIALES DE DATOS PORTALES INTERNACIONALES DE OPEN DATA DATA.un. · ONU de Datos unifica las principales bases de datos de las Naciones Unidas y las de distintas organizaciones internacionales en un único entorno de Internet. UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana.data. · La colección principal es la de los indicadores del desarrollo mundial e incluye las estimaciones nacionales.org/ · Acceso libre y abierto a los datos sobre el desarrollo de los países de todo el mundo. regionales y mundiales. 163. Los pioneros han sido los gobiernos de Estados Unidos y de Reino Unido a partir del año 2009. 9 http://data.gov http://data.org/ Aspira a ser un índice global actualizado de portales de datos abiertos en el mundo. regionales y nacionales.Madrid  Tel.GOV http://www. tablas con formato previo.

0 ó Web Semántica).net . PORTAL DE OPEN DATA DE LA UE http://open-data. http://www. . etiquetas o “tags” y por formatos de representación. Sus objetivos son defender el ‘conocimiento libre’: cualquier material.europa. 2011.Madrid  Tel. European Journalism Centre y la Open Knowledge Foundation.es La administración local pionera en abrir sus datos.es/datos/ y http://aporta.ar/manual-data/ UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana.unir. 8 pl. · Este portal forma parte del proyecto Aporta. especialmente de maneras automatizadas15. 14 Open Knowledge Foundation (OKF) es una organización sin fines de lucro fundada en 2004 en Cambridge. 15 Manual de Periodismo de Datos. Londres.zaragoza. dato o contenido libre para que cualquiera pueda usarlo o redistribuirlo sin restricciones.com.gob. Turismo y Comercio para promover la reutilización de información en el sector público. 163.EL DATA HUB http://datahub. · Contiene también una decena de conjuntos de datos en formato “Linked Data” (Tecnología Web 3. El catálogo de datos incluye cientos de conjuntos de datos ordenados por temática. 91 5674391  http://www. FUENTES OFICIALES DE DATOS PORTALES NACIONALES DE OPEN DATA 10 PORTAL DE DATOS DEL GOBIERNO DE ESPAÑA DATOS ABIERTOS DE ZARAGOZA http://datos. · Contiene una lista de sitios web de datos abiertos de los Estados miembros de la UE.es Permite accede a través del catálogo a los distintos sitios web y recursos del Sector Público.io/es/ Un recurso comunitario manejado por la Open Knowledge Foundation14 que facilita buscar.lanacion. Traducción La Nación Data. una iniciativa del Ministerio de Industria.eu/ Punto de acceso a los datos de las instituciones y órganos de la Unión Europea. Reino Unido. Disponible en: http://interactivos. compartir y reutilizar fuentes de datos abiertamente disponibles.

unir. CATÁLOGO DE DATOS DE ASTURIAS http://www. la evolución y desarrollo de todas estas iniciativas nos conducirá a una nueva etapa de Internet.euskadi. · Publica los datos en diferentes formatos. que permite incrustar datos semánticos dentro del código HTML. 8 pl. · Cada conjunto de datos está representado en diferentes formatos. · Fue el primer portal a nivel mundial compuesto íntegramente mediante tecnologías Linked Data (Web Semántica). ARAGÓN OPEN DATA http://opendata. la mayoría de ellos estándar. · Se pueden realizar búsquedas de información acotando por el formato seleccionado. 91 5674391  http://www. En un futuro.es/ El portal está desarrollado íntegramente sobre tecnología abierta con código libre.· El catálogo utiliza tecnologías muy avanzadas para la representación. La Fundación CTIC desarrolló para este portal una herramienta que permite conservar datos en un almacén semántico.net/w79-home/es/ Uno de los portales pioneros de España. OPEN DATA EUSKADI http://opendata.es/portal/site/webasturias/ El Gobierno del Principado de Asturias fue pionero en publicar un portal de datos abiertos. como RDFa.Madrid  Tel. .asturias.aragon.net 11 . lo que hace posible la reutilización universal de los mismos. donde un sitio web sea un servidor de archivos… UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. 163.

funciones de los periodistas. 2013. A través de las visualizaciones interactivas del periodismo de datos se deja al lector que consiga sus historias. ¿Olvidan los periodistas el potencial del periodismo?. El periodismo de datos es un dosificador de datos. 18 ABAD. ESO ES LO QUE HACE EL PERIODISMO DE DATOS Y LA VISUALIZACIÓN DE DAT OS 18. pp. Comunicación y la red. El periodismo de datos puede diferenciarse según su objetivo: si. funciones del documentalista. 91 5674391  http://www. 8 pl. . distingue cuatro fases en el proceso de producción.PERIODISMO DE DATOS El periodismo de datos consiste en usar herramientas estadísticas y de visualización para contar mejor las viejas historias y descubrir nuevas historias que contar16. Aida María. 334. periodismo de siempre. por otro.net . Recursos digitales para la investigación: Periodismo de datos. saber qué significa y de ahí poder construir una historia con fundamento17. Mediante una infografía. Comunicação & Sociedade.es/peridosimodatos/ 19 Vicente Domínguez. 8 de noviembre de 2012. limpieza de datos. Se reafirma el doble objetivo del periodismo de datos: crear historias a partir de los datos y que las historias ayuden a formar bases de datos (utilizables a posteriori en otros relatos y por otros profesionales). la pirámide invertida del periodismo de datos: obtención de datos. Asociación de Periodistas de Aragón. 12 En el Periodismo de Datos cobra importancia la infografía. 211. investigador y gran impulsor de esta especialidad. Paul Bradshaw.yorokobu. de la Big Data. narración. Nuevas formas de periodismo. UNIDOS. Asociación de periodistas de Aragón. Zorraquín Catalán. 16 Flores Vivar. 2012. Ecosistema del periodismo de datos. pero la diferencia se encuentra en la participación del sujeto receptor. o si. personalizar y utilidad de la información19. humanizar. 7-35. por un lado. lo que denomina. Jesús. No sólo es importante poder obtener un dato.Madrid  Tel. “LA ORGANIZACIÓN (DE LOS DATOS) LES DA SENTIDO Y. 163. Jorge. comunicación social. Yorokobu. También define seis posibles formas de comunicarlo: visualización. contextualización y combinación. Lo verdaderamente valioso en contextualizarlo y situarlo. Comunicación y la Red.unir. pág. Zaragoza. PUEDEN DESVELAR REALIDADES ESCONDIDAS HASTA ENTONCES. CRUZADOS. Mar. pretende recoger e interpretar una serie de datos para contar una historia. 2013. el periodista expone una noticia. El periodismo de datos: periodismo de hoy. pág. busca conformar sus propias bases de datos. Nuevas formas de hacer periodismo. de la Open Data. Disponible en: http://www. 17 UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. profesor de la Universidad de Birmingham (RU).

Online Journalism Blog. 163. The Inverted Pyramid of data Journalism.net 13 .blogspot. 91 5674391  http://www.es/ UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. . Disponible en: http://ojournalism. Paul.unir.com.LA PIRÁMIDE INVERTIDA DEL PERIODISMO DE DATOS 20: FASES DEL PROCESO DE PRODUCCION Compilar Limpiar Contextualizar Combinar FORMAS DE COMUNICAR LOS DATOS Visualiza ción Narración Comunicación social Humanizar Personalizar Comunicación 20 Bradshaw. 2011. 8 pl.Madrid  Tel.

FASES DEL PROCESO DE PRODUCCION 1. ubicaciones y terminología de especialistas.Madrid  Tel. formularios online o crowdsourcing 2. prejuicios y objetivos”. 21 Bradshaw. . COMPILAR Bradshaw considera que el periodismo de datos empieza en una de las dos formas: o tienes una pregunta que necesita datos o tienes un set de datos que necesitan ser interrogados.com/2011/07/07/the-inverted-pyramid-ofdata-journalism/ UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana.unir. LIMPIAR 14 Tener información es sólo el comienzo. Paul. Disponible en: http://onlinejournalismblog. clasificaciones. Para Bradwshaw “estar confiado en las historias escondidas dentro de las bases de datos significa poder confiar en la calidad de los datos y eso significa limpiar los datos”21.net . 91 5674391  http://www. Por tanto es necesario preguntar a los datos:  ¿Quién recolectó los datos encontrados?  ¿Cuándo y por qué motivos?  ¿Cuál fue la metodología utilizada para la recolecta de datos?  Es necesario entender la jerga: códigos que representan categorías. CONTEXTUALIZAR Con este punto. 8 pl. Hay formas de limpiar los datos en Excel o en Google Docs. 163. 22 de enero de 2011. La compilación de la información puede tener varias formas:  Datos encontrados en los sitios web  Al hacer scraping (rascar) de bases de datos online  Convertir documentos en algo que pueda ser analizado mediante DocumentCloud  Tomando información de APIs  Recolectando los datos a través de encuestas. Data journalism. Traducción Mauro Accurso. 3. Bradwshaw pretende advertir sobre la fuente de dónde obtenemos los datos: “Viene con sus propias historias.

Comunicación Social: es importante comunicar las visualizaciones e infografías a través de los medios sociales: blogs.Por ejemplo. Narración: una visualización siempre debe ir acompañada de un texto que lo contextualice.unir. (http://en. Utilidad: atrae usuarios en varios puntos de la cadena de comunicación. 163.  Evitar el espectáculo sin profundidad o Churnalism22  Enfocarse en no más de cuatro puntos de datos  Asegurarse que el gráfico es autosuficiente. el parque de vehículos.net 15 . contiene un enlace a la fuente 2. FORMAS DE COMUNICAR LOS DATOS Finalmente hay que comunicar los datos. y demás. pero sólo se vuelve relevante cuando se contextualiza junto con la población.wikipedia. 91 5674391  http://www. 22 Una forma de periodismo sin control ni investigación. 3. Personalizar: intenta mostrar al público la cercanía de los datos. Existen iniciativas de crowdsourcing con el objetivo de recolectar data. la densidad de tráfico. Esto nos lleva a la segunda pirámide del periodismo de datos. cómo le afectan personalmente. COMBINAR A menudo las buenas historias se obtienen combinado varios set de datos. Visualización: la forma más rápida de comunicar los resultados del periodismo de datos. Humanizar: graba entrevistas con personas que humanicen los datos abstractos. conocer el número de accidentes de tráfico en una ciudad es interesante. Facebook. 6. 5. 8 pl.org/wiki/) UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. 4. La información también es social. . La combinación clásica a la que se refiere Paul Bradshaw es el mashup de mapas: tomar un set de datos y combinarlo con datos de mapas para proveer una visualización instantánea de cómo algo está distribuído en el espacio.Madrid  Tel. 4. 1.

mediante las tablas de Google Fusion y Tableau. The Guardian’s Datablog.ar/nacion-data-t48587 El diario argentino La Nación es también pionero en ofrecer datos e investigaciones utilizando el periodismo de datos. El periódico inglés fomenta la reutilización.com/news/datablog Pionera del periodismo de datos con herramientas libres. Se encuentra disponible en línea. 163. · El Blog La Nación Data obtuvo el primer premio de los Data Journalism Awards (DJA 2013). programadores y diseñadores de diferentes países para abordar el uso de datos en periodismo. UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana.Madrid  Tel. · Contiene el blog del periodista Simon Rogers. abierto y gratuito. 91 5674391  http://www. 8 pl.net .unir. cuyo documento original Data Journalism Handbook es el trabajo colectivo de periodistas. sobre la investigación exclusiva sobre los gastos en el Senado argentino. · Nación Data ha traducido al español el Manual de Periodismo de Datos.theguardian. · The Guardian recibió cinco nominaciones a los favoritos de los Premios de Periodismo de Datos (DJA 2013).com/news/datablog/2013/apr/27/ data-journalism-awards-2013-shortlist#list LA NACIÓN DATA http://www.lanacion. liberando los datos de sus visualizaciones.theguardian. 16 http://www. El 90% del trabajo que realizan se lleva a cabo en Excel.com. investigadores. el único premio internacional de periodismo exclusivamente por datos. iniciado en 2009 y conocido como el mejor blog de datos relativos al periodismo.A continuación se muestran algunas iniciativas en Periodismo de Datos: PERIODISMO DE DATOS: MEDIOS DE COMUNICACIÓN INTERNACIONALES EL DATABLOG DE THE GUARDIAN http://www. . en la categoría de Periodismo de Datos e Investigación en grandes medios.

.unir.net 17 . Ha publicado visualizaciones interesantes de periodismo de datos.es al mejor proyecto de periodismo de datos entregado en colaboración con el grupo español de la Open Knowledge Foundation (OKF). como ganador del premio eldiario.eldiario.es Periódico digital que inició su andadura en septiembre de 2012. · Ofrece gráficos interactivos sobre diferentes temáticas. 91 5674391  http://www.Madrid  Tel. · Eldiario. 163.ES http://www. 8 pl.es eligió en mayo de 2013 el proyecto sobre la memoria histórica “Vidas contadas”.es/datos Laboratorio de Periodismo de Datos del Departamento de Innovación Audiovisual de Televisión Española.PERIODISMO DE DATOS MEDIOS DE COMUNICACIÓN NACIONALES LAB DE RTVE http://lab. UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. ELDIARIO.rtve.

21 de octubre de 2013. POCO EXPLORADO 23.unir. Si es necesario. . Los cuentacuentos se encargan de hallar ángulos y perspectivas interesantes para contar una historia y cautivar a la audiencia. 23 Open Knowledge Foundation (OKF).net . Guía: Debe monitorear las aventuras de la misión y guiar a los exploradores.EXPEDICIÓN POR EL BIG DATA Y EL OPEN DATA La Escuela de Datos de OKFN divide a los exploradores en: Cuenta cuentos: Son clave para definir la pregunta de arranque y la finalización de la misión.schoolofdata. Scout: Encargados de buscar y cazar datos interesantes en la web. SIN TRATAR. 91 5674391  http://www. Diseñadores: Embellecen los datos que proporcionan historias mediante gráficos estáticos e interactivos. 163. Escuela de Datos. Disponible en: http://es. Traducción Soci@l TIC. Los scouts tienen la dificultad de normalizar algunos datos de libre acceso. aporta material adicional.org UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. UNA EXPEDICIÓN DE DA TOS ES LA EXPLORACIÓ N DE UN TERRITORIO SALVAJE. 18 Analista: Resuelven las hipótesis que el cuentacuentos ha planteado tras interpretar y comparar los datos que los scouts han presentado.Madrid  Tel. 8 pl.

2011. 1. Se aconseja:  Guardar una copia del registro de pedido de modo que en el futuro se pueda demostrar el envío. Algunos autores le llaman “el gurú de los datos”. 4. Es preferible no buscar determinado contenido directamente. Londres. 2.Madrid  Tel. UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. 8 pl.  Si finalmente no hay respuesta. Google y otros motores de búsqueda permiten buscar por tipo de archivo. conduce al portal de la Dirección General de Tráfico. . no a la persona de relaciones públicas o comunicación de la empresa.EN LA BÚSQUEDA DE DATOS ABIERTOS En primer lugar se debe acudir a la persona que tiene los datos. Las primeras búsquedas nos ayudan. en caso de tener que apelar por falta de respuesta. pero también sobre el formato. apartado Estadísticas e indicadores. De esta forma se crea presión sobre la institución pública para que responda al pedido. 163. por lo que es aconsejable iniciar de nuevo la búsqueda de la información. 91 5674391  http://www.net 19 . es recomendable preguntar en foros y asociaciones relacionadas con el tema. se transforma en noticia por el derecho de acceso a la información 24 Manual de Periodismo de Datos. el encargado de la información demandada. sino lugares donde puede haber datos disponibles en gran cantidad. a concretar lo que se quiere contar. además de a encontrar información. la búsqueda: accidentes tráfico Madrid Excel.unir. European Journalism Centre y la Open Knowledge Foundation (OKF). 5. un Pedido de Acceso a Información (PAI) puede ser la mejor herramienta. 3. Traducción La Nación Data.  Acelerar la respuesta haciendo público la presentación de un pedido. Imprescindible ajustar la búsqueda: incluir términos relacionados con el contenido. ya que a veces no les importa compartir información que ya han obtenido de la administración pública con otros proyectos similares. Por ejemplo. Durante la exploración de los datos. Si se cree que un ente oficial tiene los datos necesarios. ni a través de un pedido de acceso a la información (PAI)24.

tendremos que cruzar esos datos con el número de coches y habitantes que han pasado por los diferentes barrios de esa ciudad. 163. European Journalism Centre y la Open Knowledge Foundation (OKF). los más comunes. y. tales como los nombres de personas. La interpretación de los números varía según se combinen. PRODUCIR COHERENTEMENTE Y PENSAR CRÍTICAMENTE ACERCA DE DATOS.   20 Lo más importante. en segundo lugar. 2011. ser creativo pensando en las historias alternativas que podrían ser coherentes con los datos obtenidos.net . Traducción La Nación Data. Cosas que no deberían encontrase allí. Traducción La Nación Data. una lista negra. es tener un pensamiento crítico. 26   También puede ocurrir que las leyes de confidencialidad prohíban difundir algunas variables y datos. EN VEZ DEL SUBCONJUNTO QUE RESPONDERÍA A LAS PREGUNTAS PARA LA HISTORIA INMEDIATA. 25 Esta alfabetización también incluye el ejercicio de trabajar con grandes conjuntos de datos.EN LA INTERPRETACIÓN DEL OPEN DATA LA ALFABETIZACIÓN EN MATERIA DE DATOS ES LA CAPACIDAD DE MANEJAR DATOS PARA CONOCER. No tiene la misma relevancia tres accidentes en una calle por donde circulan 500 coches al día. European Journalism Centre y la Open Knowledge Foundation (OKF).Madrid  Tel. que el mismo dato de siniestros en una zona que sólo circulan 50 coches diarios. conociendo cómo se obtuvieron y establecer posteriormente diferentes combinaciones con las que podamos llegar a distintas interpretaciones. Otro aspecto importante es el rigor al analizar los datos. Para ello antes identificaremos lo evidente (los mayores.unir. No pensar sólo en el dato que estamos estudiando. 2011. Londres. . 26 Manual de Periodismo de Datos. etc. UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. los extremos. Otra manera de analizar los datos que nos lleven a una historia es buscar exclusiones. Si estamos explorando el número de accidentes que ha habido en una ciudad.) 25 Manual de Periodismo de Datos. 8 pl. A MENUDO ES UNA BUENA IDEA PEDIR TODAS L AS VARIABLES Y REGISTROS EN LA BASE DE DATOS. sino también en los datos que pueden influir en su interpretación. Por ello hay que intentar universalizar el campo de actuación. Londres. 91 5674391  http://www. siempre.

cruzar los datos. PROCESADO DE DATOS. Los datos han de ser cargados en una base de datos que actúa como almacén principal. JSON. se debería recurrir a la introducción manual de los datos. 8 pl. XML. que obligan a un procesado específico con técnicas denominadas scraping (rascado). . 91 5674391  http://www. se denomina “minería de datos”: extracción de información útil (conocimiento) del agregado masivo de datos. el “almacén de los datos” (Data Warehouse). VISUALIZACIÓN.unir.Madrid  Tel. A partir de los datos conservados en el almacén de datos se preparan distintos procesos para extraer información y conocimiento útil. habrá campos de las tablas que no interese almacenar y formatos de los datos que haya que convertir. Son herramientas libres. a gran escala. Sólo en último caso y si la información lo exige.HERRAMIENTAS DE EXTRACCIÓN Y VISUALIZACIÓN Las herramientas digitales que se exponen permiten desarrollar cada una de las fases del periodismo de datos sin necesidad de recurrir a un programador. 163. Por ejemplo. o a una serie de ficheros que exportan esa misma información en un fichero estándar: CVS (tabla de campos separada por comas). acompañadas de artículos periodísticos que los contextualicen. en la fase de procesado. en el sentido de “Software Libre y de Código Abierto”. Los datos se presentan mediante representaciones gráficas estáticas e interactivas. En este almacén de datos se pueden incorporar diferentes fuentes de información para posteriormente.net 21 . que exigen más esfuerzo de extracción: información en páginas web en formato HTML o ficheros “pdf”. LA TRANSFORMACIÓN. ALMACENAMIENTO DE DATOS. Este proceso. Dan respuesta a las siguientes preguntas: ¿Cómo extraigo los datos? ¿Qué métodos utilizo para analizar y mostrar visualmente la información? LA EXTRACCIÓN DE LOS DATOS CONSISTE EN EL ACCESO A LA FUENTE ORIGINAL DE LOS DATOS . Lo óptimo es acceder a una base de datos de un organismo/institución. Los datos extraídos pueden tener que ser preparados o transformados para ser introducidos en su lugar de almacenamiento. UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. En otros casos se tendrá acceso a formatos menos “amigables”.

· La base de datos que utiliza (MySQL) permite gestionar los datos del blog. 163. 8 pl.HERRAMIENTAS EXTRACCIÓN DE DATOS PENTAHO DATA (KETTLE) http://sourceforge.Madrid  Tel. 22 · La mayoría de los “scrapers” y sus bases de datos son públicos y pueden ser reutilizados. · Los periodistas e investigadores pueden scrapear los datos y utilizarlos en otras aplicaciones. UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. · Los procesos se configuran a través de un interfaz gráfico.com/ Herramienta para extraer datos útiles de archivos PDF (scrapear).wordpress.net/projects/pentaho/?source=pdlp Herramienta completa de extracción. HERRAMIENTAS ALMACENAMIENTO DE DATOS WORDPRESS http://es. SCRAPERWIKI https://scraperwiki. Su flexibilidad permite construir aplicaciones web más complejas. · Cubre los procesos de extracción de los datos.net . sin necesidad de programación.unir. Esta parte de la base de datos sólo pueda ser vista por los administradores del blog. en una base de datos. 91 5674391  http://www. · Puede actuar como almacén principal de los datos que se vayan extrayendo (Data Warehouse). transformación de su formato y carga en su lugar natural de almacenamiento. la parte de publicación de visualizaciones y artículos periodísticos. transformación y carga de datos. .com/ Es una aplicación de gestión de contenidos orientada a blogs.

estado o país.com/ 23 Visualiza y analiza datos geoespaciales.unir. · Publica infografías online.html#fusiontables Elaboración de tablas dinámicas. http://cartodb. UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. 91 5674391  http://www. Gráficos de burbujas.net . MEIPI http://meipi. En los mapas colaborativos participan los ciudadanos aportando información.com/drive/apps.Madrid  Tel.am/ Herramienta gratuita para volcar los datos de Excel y visualizar y ordenar el contenido. 8 pl. etc.google.es/maps/ Permite mostrar visualizaciones sobre la cartografía de Google. gráficos circulares.HERRAMIENTAS VISUALIZACIÓN DE DATOS INFOGRAM http://infogr. · Crea infografías interactivas. GOOGLE MAPS API https://www. Se pueden incrustar en un blog o en un artículo periodístico GOOGLE FUSION TABLE CARTODB http://www.org/ Permite crear mapas colaborativos y vincularlo a información generada por los usuarios. 163.google. También puede importar archivos CSV. . diagramas de árbol. Creación de mapas de múltiples capas provocando visualizaciones dinámicas. Georreferenciación por dirección o cualquier región administrativa como condado.

PÁGS.HTML Los periodistas Angélica Peralta. PASADO. Cynthia O’Murchu. MARIO.net . 8 pl. 2011. minería de datos y Open Data.DO 24 Conocerás conceptos relacionados con Big Data. LANACION. PRESENTE Y FUTURO. 163. y Sarah Slobin. de The Guardian. de Financial Times.Madrid  Tel. de La Nación (Argentina). TELEFONICA. TRADUCCIÓ N LA NACIÓN DATA. de la Escuela de Periodismo Walter Cronkite (Arizona). Simon Rogers. TELOS: CUADE RNOS DE COMUNICACIÓN E INNOVACIÓN. colaboradores del Manual de Periodismo de Datos. la gestión de la privacidad de la información y la dimensión del concepto Big. UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. PASADO. INTRO DUCCIÓN: BIG DATA.unir. Steve Doig. ALGUNOS EJEMPLOS FAVORITOS DE PERIODISMO DE DATOS MANUAL DE PERIODISMO DE DATOS. LONDRES.COM/DYC/T ELOS/REVI STA/DOSSIER/DETALLEA RTCULOTELOS_95TELOS_ DOSSIER0/SECCION=126 6&IDIO MA=ES_ES&ID=20130621 10090002&ACTIVO=6. de Wall Street Journal. EUROPEAN JOURNALISM CENTRE Y LA OPEN KNOWLEDGE FOUNDATION (OKF).LO + RECOMENDADO NO DEJES DE LEER… INTRODUCCIÓN: BIG DATA. JUNIO – SEPTIEMBRE 2013. Brian Boyer.COM. Nº 95. narran sus ejemplos favoritos de periodismo de datos y qué les gusta de los mismos.AR/MANUALDATA/INTRODUCCI%C3%B 3N_3. HTTP://SOCIEDADINFORMACION. 47-50. de Chicago Tribune. como Business Intelligence. 91 5674391  http://www. . PRESENTE Y FUTURO TASCÓN. HTTP://INTERACTIVOS.FUNDACION. El autor reflexiona sobre las denominadas “3V” de Big Data.

. alfabetización.unir.SHTML UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. 8 pl. Se pueden consultar datos sobre mortalidad. edades. rifles de asalto y armas automáticas ligeras. como revólveres.COM/PR OJECTS/ARMSGLOBE/ 25 LABORATORIO DE INNOVACIONES AUDIOVISUALES DE TELEVISIÓN ESPAÑOLA En la siguiente imagen se muestra la visualización interactiva37 sobre la situación de la mujer en el mundo que realizaron para conmemorar el Día Internacional de la Mujer en 2012. hacer clic sobre los diferentes países y utilizar una línea de tiempo al pie para ver los cambios en tendencias en distintos años. 163.ES/DIA-MUJER/DIA-INTERNACIONAL-MUJER-MUNDO. EL VÍDEO ESTÁ DISPON IBLE EN LA SIGUIENTE DIRECCIÓN WEB: HTTP://LAB.net . 91 5674391  http://www. La visualización es parte de la iniciativa Google Ideas.CHRO MEEXPERIMENTS.RTVE.NO DEJES DE VER LA VISUALIZACIÓN INTERACTIVA DE LAS ARMAS PEQUEÑAS AUTORIZADAS POR LOS GOBIERNOS Y LAS TRANSFERENCIAS DE MUNICIONES 1992-2010 Google Creative Lab en colaboración con el Igarape Institute ha creado una visualización interactiva que muestra la tierra con líneas encendidas que indican las importaciones y exportaciones de los países en municiones y armas pequeñas. número de hijos. EL GLOBO INTERACTIVO ESTÁ DISPONIBLE EN L A SIGUIENTE DIRECCIÓ N WEB: HTTP://WORKSHOP. Puedes manipularla para hacer acercamientos alrededor del globo. etc.Madrid  Tel.

enero – abril de 2013. http://revistas. comunicar y calcular información.fundacion. Martin.unir. Trabajo fin de Master en Investigación en Documentación.es/knowledge-center/tendencias-2012-las-tres-v-de-big-data-17819 FLORES. El periodismo de datos y la web semántica. Telos – Cuadernos de Comunicación e Innovación. GARRIGA. Mar.es/peridosimodatos/ ANTÓN. 44.yorokobu. 18.php/CIYC/article/view/41718/39756 BRADSHAW. Marc. 14 de enero de 2012. El Frankenstein español del Open Data. Comunicación y Documentación. 2012.ucm. 60-65. Adolfo. Universidad Carlos III. 8 pl. Jesús. vol. Paul.do HILBERT. 99-116. Yorokobu. 163.com/doc/111830154/La-relacion-del-Periodismo-de-Datos-con-Big-Data-y-Open-Data UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana.telefonica. MARIÑO. Priscila. 8 de noviembre de 2012. Ecosistema del periodismo de datos. 2013.blogspot.com.es/ FERNÁNDEZ. Universidad Complutense. pp.es/index. SilicomWeek. 1 de abril de 2011. pp. 7-35.siliconweek. 2012. Ángeles.scribd. ¿Olvidan los periodistas el potencial del periodismo?. LÓPEZ. Ciencia. . La capacidad tecnológica del mundo para almacenar. http://www.com/DYC/TELOS/REVISTA/Dossier/DetalleArtculoTELOS_94 TELOS_DOSSIER3/seccion=1266&idioma=es_ES&id=2013021317580001&activo=6. pág. http://www. Pablo. Online Journalism Blog. 2011. 26 http://ojournalism.Madrid  Tel. vol. Tendencias 2012: Las tres ‘V’ de Big Data. http://es. nº 6025. Facultad de Humanidades. pp. 332.+ INFORMACIÓN BIBLIOGRAFÍA ABAD. nº 94. 91 5674391  http://www. Cuadernos de Información y Comunicación – CIC. http://sociedadinformacion. Comunicação & Sociedade. La relación del Periodismo de Datos con Big Data y Open Data.net . The Inverted Pyramid of data Journalism.

periodismo de siempre. 163. http://interactivos.fundacion. Traducción La Nación Data. pág. 334.Madrid  Tel. . European Journalism Centre y la Open Knowledge Foundation. pág. Telos – Cuadernos de Comunicación e Innovación. De los datos al Big Data. Jorge.com. nº 95. Londres.net . El periodismo de datos: periodismo de hoy.do VICENTE. Asociación de periodistas de Aragón. Comunicación y la red. 211. 2011. http://sociedadinformacion. Soraya. ZORRAQUÍN. Nuevas formas de hacer periodismo. Asociación de Periodistas de Aragón.com/seccion=1266&idioma=es_ES&id=2013062110130001 &activo=6. 2013. 2013.lanacion. Nuevas formas de periodismo.unir. Aida María.Manual de Periodismo de Datos.telefonica.ar/manual-data/ PANIAGUA. 8 pl. Recursos digitales para la investigación: Periodismo de datos. Comunicación y la Red. 91 5674391  http://www. 27 UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana. junio – septiembre de 2013. Zaragoza.

91 5674391  http://www.Madrid  Tel.28 UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana.net . 8 pl. .unir. 163.

ex alumnos. . emprendedora y. debates. presenciales online para que Más  Clases Masters.unir. SÍGUENOS: La Universidad en Internet es Queremos expandir la educación. 163. sobre todo. Contenido de actualidad: Masterclasses. actualidad y es noticia. enseñanza allí donde se necesita. tutores. prensa. 91 5674391  http://www. LA UNIVERSIDAD EN INTERNET Descubre un nuevo concepto de Universidad de 30 titulaciones oficiales: Grados. trabajadores y amigos de la Universidad. redes sociales. 29 Vida académica y social UNIR Alumni UNIR TV Organizamos y formamos parte de grandes eventos: conferencias. radio. El rincón de la comunidad UNIR: alumnos. una Universidad activa. 902 907 132 WWW. seminarios. solidaria. profesores. charlas con expertos. Tedx UNIR. 8 pl.net .NET UNIVERSIDAD INTERNACIONAL DE LA RIOJA Paseo de la Castellana.000 alumnos de 50 tutor personal a tu disposición Más Un nacionalidades nos avalan desde el primer día práctica pensada de enseñanza eficaz Educación Metodología para la realidad profesional basada en las nuevas tecnologías Sigue descubriendo todo lo que significa UNIR. vídeos educativos. La única Universidad con un canal propio de televisión. innovadora.BIENVENIDO A UNIR. Contamos con nuestra propia aceleradora de Startups.Madrid  Tel. Tenemos una Hemos creado un innovador programa relevante presencia en los medios de de voluntariado online para llevar la comunicación: televisión. idiomas… UNIR en los medios Campus Solidario UNIR Emprende Estamos comprometidos con los emprendedores.UNIR. comprometida con tu éxito. Doctorado asistas en directo o las veas en diferido de 18.