Posts Tagged ‘gephi’

FICOD visto desde twitter

8 Comments »

La relevancia de Twitter es cada vez mayor en los eventos, tanto para los organizadores como para los asistentes. Para los organizadores es una canal de comunicación directo con los asistentes y a éstos les permite sentirse integrados dentro del evento y conocer todo lo que ocurre dentro de él en tiempo real.

Los asistentes no son solo los presenciales, también hay que incluir a los presentuales (término creado por Fernando Sáez Vacas) que siguen las conferencias por streaming y se comunican vía Twitter con el resto de asistentes. Mientras transcurre el evento se intensifican los tweets entre usuarios que ya se conocían, se establecen nuevas conexiones y sobre todo se opina y se difunden las opiniones de otros.

Todo evento tiene asociado su hashtag oficial para aglutinar la conversación que fluye entre los asistentes y hacerla visible a todos los interesados. Gracias a los hashtags oficiales es posible recolectar con bastante precisión los tweets del evento.

Me pareció muy interesante analizar la conversación intensa de estos eventos y realizar una comparación entre ellos. Empecé por el FICOD y en este post muestro los primeros resultados correspondientes a la red que se forma con las menciones de unos usuarios a otros.

Red de menciones, color por relevancia

Tamaño de los nodos según el número de menciones obtenidas y realizadas (Degree)

Código de colores:

  • Rojo= Usuarios que pertenecen al grupo de  los 50 más mencionados y los 50 más activos twiteando,
  • Verde= Usuarios que están entre los 50 más mencionados,
  • Azul oscuro= Los 50 usuarios que más han twiteado
  • Azul twitter= Resto de los usuarios

Zoom del centro de la red, color por relevancia

Red de menciones, color por seguidores


Tamaño de los nodos según el número de menciones obtenidas y realizadas (Degree)

Código de color según número de seguidores:

  • Gris claro=entre 0 y 9 .
  • Amarillo= entre 10 y 99
  • Verde= entre 100 y 999
  • Azul= entre 1000 y 9.999
  • Morado= entre 10.000 y 99.999
  • Rojo= entre 100.000 y 1.000.000

Zoom del centro de la red, color por seguidores

Red de los 50 usuarios más activos y los 50 más mencionados

Se ha seleccionado los usuarios más destacados entre los 50 más mencionados y los 50 más activos twiteando, algunos de ellos pertenecen a ambos grupos. Las relaciones de los grafos que se muestran a continuación son las menciones entre estos usuarios. Por tanto, muestran el grado de relación de los nodos más relevantes. El código de color utilizado es:

  • Rojo= entre los más mencionados y los más activos,
  • Verde= Entre los más mencionados,
  • Azul oscuro= Los más activos twiteando

El tamaño de los grafos difiere según la medida de la relevancia

  • Tamaño de los nodos según menciones recibidas (In-degree)

  • Tamaño de los nodos según número de menciones realizadas (Out_degree)

  • Tamaño de los nodos según el número de menciones recibidas y realizadas (Degree)

Datos de interés

  • Se recogieron 25.135 tweets de 5.503 usuarios distintos que dieron lugar a 15.738 menciones de 5.238 usuarios.
  • Los tweets fueron recogidos con una aplicación propia usando el Streaming API de Twitter desde 13 de noviembre de 2010 a las 09:48:04 hasta el 18 de noviembre de a las 23:58:19 monitorizando los hashtags #FICOD, #FICOD10, #FICOD2010
  • El grafo se ha generado con una herramienta propia
  • Las visualizaciones se han realizado con la aplicación Gephi

Taller de visualización: Redes

10 Comments »

Los días 2º y 3º del taller se han dedicado a la visualiziación de redes. Se han realizado prácticas con las herramientas Graphviz, Pajek, Gephi y Touchgraph.  Cada una de ellas se puede encuadrar entre dos páramentos: la potencia de visualización y la ayuda para el  análisis. Esta clasificación se puede ver en  el gráfico anterior y puede dar una idea sobre cúal es la herramienta que mejor se adapta a la necesidad de cada uno.

La grabación de la sesión está disponible en la web de Camon y los talleres de las distintas herramientas están accesibles en:

La presentación en Slide share


Propagación de tijerasNO, Parte I

5 Comments »

Experimento completo en BarriBlog Wiki

La campaña de “Tijeras No”  fue una reacción contra los recortes de I+D en la que afloraron el barrio de blogs vinculados a la Ciencia. La movilización a favor de la Ciencia y la rápida propagación de la campaña despertó mi curiosidad asaltándome una serie de preguntas que han sido la motivación que me ha llevado a recoger los datos de los participantes en la campaña para analizarlos.

Con este experimento se intentará responder a las preguntas:

  1. ¿Qué relación existe entre los blogs que han participado en la campaña de la campaña?
  2. ¿Cómo fue la propagación?
  3. ¿Influyó Twitter en la propagación?

¿Qué relación existe entre los blogs que han participado en la campaña de la campaña?

Capture your screen in seconds

En el siguiente vídeo contiene una animación de la red que forman los blogs que no amaban los recortes en la ciencia. El código de color es:

  • Verde los adheridos antes del día D (7 de octubre)
  • Rojo los adheridos el día D,
  • Azul los adheridos después del día D

El tamaño de los nodos es directamente proporcional al número de enlaces entrantes, por tanto los de mayor tamaño son los hubs.

La red tiene 1012 nodos y un núcleo pequeño bien conectado (36%) y una extensa periferia sin conectar (64%). El número de enlaces entrantes de cada blog desde los blogs que participaron en la campaña sigue, una power law, como se puede ver en esta visualización que se ha generado en manyeyes. El 20% de los blogs tiene más del 80% de los enlaces.

En el grafo destacan como hubs los siguientes blogs:

aldea-irreductible.blogspot.com (65),  escolar.net (45),  paleofreak.blogalia.com (37), cienciakanija.com (35), fogonazos.blogspot.com (32), eumafeag.blogspot.com (28),  fisicacf.blogspot.com (27), malaciencia.info (21),  danielmarin.blogspot.com (17). biogeocarlos.blogspot.com (17),

Metodología:

  • Data set: se obtuvo de los comentarios del post de la convocatoria de La aldea irreductible. Consta de 1012 urls de los blogs adheridos a la campaña con su timestamp.
    Estos datos se han transformado con la herramienta lestat para calcular los enlaces entre los blogs. Este es el dataset en formato textual separado por tabulaciones.
  • Recursos gráficos: se usa la visualización de un grafo en el que los nodos son los blogs y sus enlaces los arcos. Se realizarán distintos layauts según la necesidad de análisis y se establece una simbología basada en:
  • El color: se utiliza el color para clasificar los distintos nodos. Por ejemplo se aplica el color para distinguir con que celeridad se han apuntado los blogs a la campaña o qué blogs tienen usuario Twitter y cuales no.
  • Tamaño: se aplican distintos tamaños a los nodos según su importancia dentro del grafo. Uno de los criterios de importancia es el número de enlaces entrantes que tiene cada blog, lo que permite identificar visualmente cuales son los hubs de esta red.

En este caso se ha usado la herramienta java Gephi, que es muy adecuada por sus features para visualizar redes de cierto tamaño. El formato de entrada a la herramienta es gexf que incluye el tiempo como atributo para poder realizar visualizaciones dinámicas, aunque aún no han liberado esa funcionalidad.  ¡¡¡¡Estoy expectante de que lo hagan!!!!

Para los más curiosos dejo los datos de entrada para Gephi para que puedan ver con sus propios ojos cómo funciona la herramienta:

Se han generado dos visualizaciones

  • Genérico: con sólo los nombres de los hubs para facilitar una visualización en pequeño tamaño. Fichero con los datos gexf y proyecto para cargar en gephi
  • Detallado: con los nombres de todos los blogs para poder navegar el grafo haciendo zoom y viendo todos los detalles de los nodos. Fichero con los datos gexf y proyecto para cargar en gephi

El zoom en Gephi se controla con la rueda del ratón.

Experimento completo en BarriBlog Wiki

http://aldea-irreductible.blogspot.com 65
http://escolar.net 45
http://paleofreak.blogalia.com 37
http://cienciakanija.com 35
http://fogonazos.blogspot.com 32
http://eumafeag.blogspot.com 28
http://fisicacf.blogspot.com 27
http://malaciencia.info 21
http://danielmarin.blogspot.com 17
http://biogeocarlos.blogspot.com 17
http://francisthemulenews.wordpress.com 14
http://palomitasymaiz.wordpress.com 14
http://abordodelottoneurath.blogspot.com 12
http://angelrls.blogalia.com 12
http://elbauldejosete.wordpress.com 12
http://singularidad.wordpress.com 12
http://mizar.blogalia.com 11
http://cienciadebolsillo.com 11
http://blogs.elcorreodigital.com/magonia 11
http://tallcute.wordpress.com 11
http://golemp.blogspot.com 10
http://enchufa2.es 10
http://cristaljar.blogspot.com 10
http://genciencia.com 10
Related Posts Plugin for WordPress, Blogger...