Professional Documents
Culture Documents
2 de Junio de 2009
2 de Junnio de 2009
NDICE
CONTENIDO..................................................................... PGINA
Estudio completo de Pajek.............................................................. 3 Anlisis de un dominio Web .......................................................... 35 Estudio con Pajek (datos inventados) .......................................... 53
EJERCICIO PAJEK
1. Estudio completo de Pajek
Para la realizacin de este ejercicio lo primero que se ha realizado es el fichero con los datos proporcionados, para ello se ha abierto el bloc de notas y se ha transcrito la informacin de la siguiente manera: Primero se ha indicado el nmero de vrtices que va a tener nuestro grafo, se ha puesto *vrtices y el nmero total de vrtices, en este caso cada vrtice corresponde a una persona, el resultado queda de la siguiente manera: *vertice 17 A continuacin se ha consignado el nmero de vrtices, seguido del nombre de la persona entre comillas. Como en la informacin proporcionada se indicaba el sexo de la persona tambin se ha indicado, para ello segn el sexo se le ha puesto un formato en el vrtice, de este modo los chicos tendrn forma de elipse (ellipse) y las chicas de caja (box), y se ha consignado detrs de cada individuo, el resultado final es el siguiente: 1 "Andrs" ellipse 3 "Carmela" box Despus de estos datos se han reproducido la relacin, para ello se ha indicado con: * Edges :1 Conoce a Esta relacin indica quien conoce a quin entre los individuos, para su consignacin se han utilizando los nmeros de los vrtices, el primer nmero se corresponde a la primera persona que conoce a otras y el segundo nmero se corresponde a la persona que conoce, el ltimo nmero es el peso de la relacin, a todas se le ha asignado el 1 que es una relacin normal, si se quisiera que tuviera ms peso la relacin se le fijara un mayor nmero, por tanto el resultado final sera: 121 Para ver las relaciones se ha indicado que nos aparezcan en un color diferente, se ha indicado as a continuacin de las relaciones: c Green El resultado final de los datos es el siguiente:
*Vertices 17 1 "Andrs" ellipse 2 "Carlos" ellipse 3 "Carmela" box 4 "Carmen" box 5 "Carol" box 6 "Dolores" box 7 "Hugo" ellipse 8 "Juan" ellipse 9 "Jos" ellipse 10 "Julio" ellipse 11 "Liliana" box 12 "Mara" box 13 "Mariano" ellipse 14 "Marta" box 15 "Nuria" box 16 "Pablo" ellipse 17 "Javier" ellipse *Edges :1 "Conoce a" 1 2 1 c Green 1 4 1 c Green 1 6 1 c Green 1 8 1 c Green 1 10 1 c Green 1 16 1 c Green 2 3 1 c Green 2 5 1 c Green 2 1 1 c Green 3 2 1 c Green 3 5 1 c Green 4 1 1 c Green
Este archivo se ha guardado con el nombre de nombres y la extensin .net puesto que es la extensin para que pueda cargarse posteriormente en Pajek. Otro de los ficheros que se tienen que realizar es la relacin que existe entre la persona y su carrera, entonces se realiza otro fichero en el bloc de notas en donde se indicar esta relacin, a este fichero se le ha llamado carreras.net y los datos se han codificado de la siguiente manera: Primero se indica los vrtices que se van a utilizar, para ello se indica el nmero de vrtices totales entre las personas y las carreras, en este caso son 21 porque hay 17 personas y 4 careras y a continuacin se indica el nmero en donde finalizan las personas que son los vrtices fijos, en este caso son 17, por tanto quedar de la siguiente manera: *Vertices 21 17 A la hora de consignar las carreras se debe indicar la forma del vrtice en este caso se le indicar un triangulo (triangle): 19 "Arqueologa" triangle A continuacin se indicarn los enlaces que se denominan arcs, el primer nmero se corresponde con la persona y el segundo con la carrera que le corresponde, el resultado final es el siguiente: *Vertices 21 17 1 "Andrs" ellipse 2 "Carlos" ellipse 3 "Carmela" box 4 "Carmen" box 5 "Carol" box 6 "Dolores" box 7 "Hugo" ellipse 8 "Juan" ellipse 9 "Jos" ellipse 10 "Julio" ellipse 11 "Liliana" box 12 "Mara" box 13 "Mariano" ellipse 14 "Marta" box
15 "Nuria" box 16 "Pablo" ellipse 17 "Javier" ellipse 18 "Antropologa" triangle 19 "Arqueologa" triangle 20 "Sociologa" triangle 21 "Psicologa social" triangle *Arcs 1 18 2 19 3 19 4 18 5 19 6 18 7 20 8 18 9 21 A continuacin se realizar el estudio con Pajek lo primero que tenemos que hacer es instalar Pajek, para ello se pincha dos veces sobre el icono de Pajek:
Y le damos a Ok:
Y empieza la instalacin, cuando ha finalizado nos muestra un mensaje como que ya ha terminado de instalarse y le damos a Aceptar:
Aparece una carpeta en donde se encuentra el archivo de Pajek y ahora ya podemos abrirlo. En la pantalla que aparece tenemos que cargar los ficheros que hemos creado anteriormente para ello se pincha sobre la carpeta que hay debajo de la palabra Networks:
Nos aparece una pantalla para que seleccionemos el archivo que queremos cargar y le damos ha aceptar:
Y nos aparece el siguiente mensaje que nos indica el fichero que ha leido las lneas que ha ledo y el tiempo que ha tardado:
Cerramos esta ventana y visualizaremos el grafo que hemos cargado para ello le damos a Draw y en el men que no sale le volvemos a dar a Draw:
Como se puede observar en el grafo que se muestra distingue lo que se le indic en el fichero que las chicas nos las indicara con una caja y los chicos con una elipse, se puede observar que tambin nos indica las relaciones:
10
Ahora tenemos que ponerlo bonito, para ello de tenemos que indicar que nos muestre las relaciones tal y como se lo indicamos en el fichero, tambin que el fondo se nos muestre del color blanco y de paso modificaremos el color de los vrtices, para realizarlo se har de la siguiente manera, se pincha sobre Options / Colors y seleccionamos los vrtices:
11
Ahora cambiaremos el color del fondo para ello pinchamos otra vez sobre Options / Colors y seleccionamos Background:
Y en la pantalla que nos sale seleccionamos el fondo blanco para previsualizar mejor el grafo y aceptamos:
12
Tambin se pueden cambiar el tamao de los nodos, en este caso no lo vamos ha hacer porque hay muchos nodos, pero el proceso sera el siguiente: Options /Size / Of Vertices:
Y nos aparece una pantalla para cambiar el tamao, una vez indicado le daramos ha Ok:
13
Tambin podramos ver el valor de las relaciones, pero en este caso como todas tienen el mismo valor no sera necesario, pero se mostrar el proceso: Option / Lines / Mark Lines / with Values:
Lo que nos queda por modificar en nuestro grafo es que nos muestre las lneas tal como se indic en el fichero para ello pincharemos sobre Options / Colors / Edges / As Definen on Input File:
14
Ahora queremos que nos muestre la relacin existente entre el individuo y la carrera que ha estudiado para ello debemos cargar el fichero primeramente que en este caso es el de carreras.net:
15
Ahora le decimos quenos muestre la red, para ello le damos a Draw / Draw:
16
Podemos realizar una particin, esto nos servir para diferenciar las categoras de las entidades sociales que tenemos para ello pincharemos sobre Net / Partitions / 2-Mode:
17
Ahora grabaremos la particin para ello pincharemos sobre el icono de guardar que hay debajo de Partition:
18
Luego podemos dibujar la red para ello vamos a Draw pero esta vez tendremos que decirle Draw Partition para ue nos dibuje la red:
19
Como se puede observar a las personas nos las ha pintado de un color y las carreras de otro.
20
Ahora guardaremos todo lo que hemos hecho en Pajek hasta ahora, para ello pinchamos sobre File / Pajek Proyect File / Save:
Ahora pasaremos a realizar las medidas de centralidad, lo realizaremos con los dos ficheros que tenemos para ello primero seleccionamos uno se realiza la medida de centralidad y luego pincharemos sobre el otro y realizaremos el mismo proceso, por tanto
21
antes de realizar una medida lo primero que hay que hacer es seleccionar la red que vamos a analizar y luego realizaremos la medida. Lo primero que vamos ha hacer es visualizar los datos, esto se realiza pinchando dos veces sobre la red que se quiere ver, y nos pregunta en que formato lo queremos, nosotros probaremos los tres formatos que hay:
Binary Matrix:
22
Valued matrix:
23
Lists:
Solo hemos visualizado los datos del fichero de nombres, a mi personalmente el que ms me gusta es el valued matrix, que es como vamos a visualizar los datos del fichero de carreras:
24
Ahora se va a proceder a realizar la medidas, la primera que estudiaremos es la densidad, lo primero que hacemos es seleccionar la red y luego la obtenemos pinchando sobre Info / Network / General:
25
Nos aparece un cuadro que nos dice que indiquemos el intervalo de lneas, lo dejamos en 0 y le damos a Ok:
Y el resultado es:
26
Ahora procederemos a calcular el dimetro, para ello pincharemos sobre: Net / Paths between 2 vertices / Diameter:
27
La siguente medida a calcular es el grado, aqu podemos decirle que nos muestre el grado de salida, el de entrada o todo, nosotros para que sea ms completo le daremos a todo, para ello se pincha sobre Net / Partitions / Degree / All:
28
El resultado en el primer fichero nos dice que se puede calcular porque hay demasiadas lneas se ha intentado calcular con los grados de salida y de entrada y nos indica lo mismo, pero en el fichero de carreras s, por tanto el resultado es:
Ahora vamos a obtener el grado de intermediacin pinchando sobre Net / Vector / Centrality / Betweenness:
29
El resultado es:
Si pinchamos dos veces sobre el vector que nos ha aparecido obtenemos los datos del vector y en este caso para el fichero de carreras no se puede saber cual es el valor ms alto porque todos tienen los mismos valores, en cambio en el de nombres se observa que los valores ms altos los tienen los individuos 1 y 9:
30
31
Ahora vamos a calcular el grado de cercana, al igual que pasa con el grado se puede calcular de salida, de entrada o para todo, nosotros lo calcularemos para todo, para ello pincharemos sobre Net / Vector / Centrality / Closeness / All:
Nos dice que no puede hallar el resultado porque la unin es muy dbil, pero se obtenido el grado de cercana de salida y de entrada y nos muestra un vector que lo visualizaremos pinchando sobre Draw y diciendole que nos visualice el vector:
32
A la hora de calcular la cercana de entrada los datos que nos ha dado son:
33
A la hora de visualizar este vector podemos indicarle que nos muestre los vrtices ms cercanos, la lnea ms corta, el nmero de cruces de lnea, cual es el ngulo mnimo entre tres vrtices, cual es el vrtice ms cercano a una lnea, pero esto son diversas maneras de visualizacin. Con esto se ha finalizado el anlisis de los datos que nos han proporcionado para la realizacin de este estudio.
34
Una vez abierto el programa se ha indicado el nombre de la Web a evaluar, se le ha indicado el directorio donde se quera guardar la informacin, como ya se ha comentado anteriormente se realizaron varias pruebas antes del anlisis definitivo, por ello el fichero tiene el nmero 13 porque es la versin que se va a utilizar, posteriormente se le ha dado a configuracin:
35
36
En el apartado de avanzado le indicamos que nos elimine los comentarios y todos los blogs que no empiecen por masquepelis.com/, estos son: .blogger.com*, widgeo.net/*, .jcahigal.es/*, .estrenosdecines.es/*, .lafaserem.com/*, pruebajuegos.es/blog*, panteram0rt0n.blogspot.com*, diario.blogspot.com/*, rafaelcine.blogspot.com*, madtigerr.blogspot.com*, susgadgets.blogspot.com*,
blogs.hoycinema.com/movieland*,
.jesusmacias.es*, .wikio.es*; para los comentarios se ha restringido con el siguiente comando: showcomment=*. Como se puede comprobar todos acaban es asterisco es para que todo lo que empiece por lo que se le ha indicado lo restringa independientemente de lo que lleve detrs. Una vez realizado esto se le ha dado ha aceptar.
37
Ahora se ha comenzado la recogida pinchando sobre el botn comenzar de la pantalla principal y el resultado ha sido el siguiente:
38
Ahora se va a realizar el grafo con los datos obtenido, en esta ocasin hay que utilizar el programa Eloisa:
39
Lo primero que se hecho ha sido ir al men Herramientas / Configuracin, para indicarle la ruta donde se encuentra el programa Graphviz y se acepta:
Ahora tenemos que cargar los datos de la recogida, se pincha sobre Archivo / Cargar Recogida:
En la pantalla que nos aparece buscamos los datos que queremos cargar y aceptamos:
40
Y nos muestra una pantalla de informacin para indicarnos si hay errores o no, y se acepta:
Se procesa el grafo de recogida, por tanto tendremos que pinchar sobre Recogida / Grafo de Recogida / Procesar grafo de la recogida:
41
En la pantalla que aparece nos muestra la informacin de los procesos que estn activos y de los que estn finalizados, indicando la operacin que ha realizado y el tiempo que ha tardado:
42
En la siguente pantalla le decimos que queremos visualizar el grafo de la recogida, ya que para visualizarlo desde un archivo primero tendramos que haber importado el los datos y le pinchamos sobre visualizar grafo:
43
Ahora vamos a exportar los datos para poder analizar con Pajek las medidas de centralidad, entonces pinchamos sobre Recogida / Grafo de la Recogida / Exportar:
44
En la pantalla que aparece le tenemos que decir que queremos que nos exporte los datos al formato de Pajek y le indicamos el directorio donde queremos que nos lo guarde y sealamos la opcin de guardar nombres en otro archivo y exportamos:
45
Ahora ya tenemos los datos en formato de Pajek para poder estudiarlo, pero antes con Eloisa podemos saber el ranquik de las pginas analizadas, para ello si pinchamos sobre Recogida / Grafo de la Recogida / Page Rank / Ver page rank d elas pginas:
46
En esta pantalla nos da la opcin de exportar estos datos en formato texto o en formato HTML. Ahora con Pajek lo que vamos a hacer es cargar la red y visualizar el grafo, ahora solo se mostrarn los resultados, puesto que el proceso ya se ha indicado anteriormente en el ejercicio anterior.
47
Ahora se estudiarn todas las medidas de centralidad y los resultados son los siguientes: La visualizacin de los datos con la opcin Valued Matrix:
Para la densidad:
48
Para el dimetro:
Para el grado:
49
50
51
52
Se han creado los ficheros DatosPatricia.net, se indica el nombre de los individuos, el estado civil, si estan casados con un triangulo y si estn solteros con una caja, y los compaeros de trabajo que han tenido. El otro fichero es DatosPatricia2.net, es una red de modo 2 aqu se muestran el puesto de trabajo de cada individuo, y el puesto de trabajo se muestra con un circulo. El grafo resultante es:
53
El estudio de las medidas de centralidad es el siguiente: Visualizacin de los datos mediante la opcin Valued Matrix:
54
55
Para la densidad:
Para el dimetro:
Para el grado:
56
57
58
59
60