La relevancia de Twitter es cada vez mayor en los eventos, tanto para los organizadores como para los asistentes. Para los organizadores es una canal de comunicación directo con los asistentes y a éstos les permite sentirse integrados dentro del evento y conocer todo lo que ocurre dentro de él en tiempo real.
Los asistentes no son solo los presenciales, también hay que incluir a los presentuales(término creado por Fernando Sáez Vacas) que siguen las conferencias por streaming y se comunican vía Twitter con el resto de asistentes. Mientras transcurre el evento se intensifican los tweets entre usuarios que ya se conocían, se establecen nuevas conexiones y sobre todo se opina y se difunden las opiniones de otros.
Todo evento tiene asociado su hashtag oficial para aglutinar la conversación que fluye entre los asistentes y hacerla visible a todos los interesados. Gracias a los hashtags oficiales es posible recolectar con bastante precisión los tweets del evento.
Me pareció muy interesante analizar la conversación intensa de estos eventos y realizar una comparación entre ellos. Empecé por el FICOD y en este post muestro los primeros resultados correspondientes a la red que se forma con las menciones de unos usuarios a otros.
Red de menciones, color por relevancia
Tamaño de los nodos según el número de menciones obtenidas y realizadas (Degree)
Código de colores:
Rojo= Usuarios que pertenecen al grupo de los 50 más mencionados y los 50 más activos twiteando,
Verde= Usuarios que están entre los 50 más mencionados,
Azul oscuro= Los 50 usuarios que más han twiteado
Azul twitter= Resto de los usuarios
Zoom del centro de la red, color por relevancia
Red de menciones, color por seguidores
Tamaño de los nodos según el número de menciones obtenidas y realizadas (Degree)
Código de color según número de seguidores:
Gris claro=entre 0 y 9 .
Amarillo= entre 10 y 99
Verde= entre 100 y 999
Azul= entre 1000 y 9.999
Morado= entre 10.000 y 99.999
Rojo= entre 100.000 y 1.000.000
Zoom del centro de la red, color por seguidores
Red de los 50 usuarios más activos y los 50 más mencionados
Se ha seleccionado los usuarios más destacados entre los 50 más mencionados y los 50 más activos twiteando, algunos de ellos pertenecen a ambos grupos. Las relaciones de los grafos que se muestran a continuación son las menciones entre estos usuarios. Por tanto, muestran el grado de relación de los nodos más relevantes. El código de color utilizado es:
Rojo= entre los más mencionados y los más activos,
Verde= Entre los más mencionados,
Azul oscuro= Los más activos twiteando
El tamaño de los grafos difiere según la medida de la relevancia
Tamaño de los nodos según menciones recibidas (In-degree)
Tamaño de los nodos según número de menciones realizadas (Out_degree)
Tamaño de los nodos según el número de menciones recibidas y realizadas (Degree)
Datos de interés
Se recogieron 25.135 tweets de 5.503 usuarios distintos que dieron lugar a 15.738 menciones de 5.238 usuarios.
Los tweets fueron recogidos con una aplicación propia usando el Streaming API de Twitter desde 13 de noviembre de 2010 a las 09:48:04 hasta el 18 de noviembre de a las 23:58:19 monitorizando los hashtags #FICOD, #FICOD10, #FICOD2010
El grafo se ha generado con una herramienta propia
Las visualizaciones se han realizado con la aplicación Gephi
Los días 2º y 3º del taller se han dedicado a la visualiziación de redes. Se han realizado prácticas con las herramientas Graphviz, Pajek, Gephi y Touchgraph. Cada una de ellas se puede encuadrar entre dos páramentos: la potencia de visualización y la ayuda para el análisis. Esta clasificación se puede ver en el gráfico anteriory puede dar una idea sobre cúal es la herramienta que mejor se adapta a la necesidad de cada uno.
La campaña de “Tijeras No” fue una reacción contra los recortes de I+D en la que afloraron el barrio de blogs vinculados a la Ciencia. La movilización a favor de la Ciencia y la rápida propagación de la campaña despertó mi curiosidad asaltándome una serie de preguntas que han sido la motivación que me ha llevado a recoger los datos de los participantes en la campaña para analizarlos.
Con este experimento se intentará responder a las preguntas:
¿Qué relación existe entre los blogs que han participado en la campaña de la campaña?
¿Cómo fue la propagación?
¿Influyó Twitter en la propagación?
¿Qué relación existe entre los blogs que han participado en la campaña de la campaña?
En el siguiente vídeo contiene una animación de la red que forman los blogs que no amaban los recortes en la ciencia. El código de color es:
Verde los adheridos antes del día D (7 de octubre)
Rojo los adheridos el día D,
Azul los adheridos después del día D
El tamaño de los nodos es directamente proporcional al número de enlaces entrantes, por tanto los de mayor tamaño son los hubs.
La red tiene 1012 nodos y un núcleo pequeño bienconectado (36%) y una extensa periferia sin conectar (64%). El número de enlaces entrantes de cada blog desde los blogs que participaron en la campaña sigue, una power law, como se puede ver en esta visualización que se ha generado en manyeyes. El 20% de los blogs tiene más del 80% de los enlaces.
En el grafo destacan como hubs los siguientes blogs:
Data set: se obtuvo de los comentarios del post de la convocatoria de La aldea irreductible. Consta de 1012 urls de los blogs adheridos a la campaña con su timestamp.
Estos datos se han transformado con la herramienta lestat para calcular los enlaces entre los blogs. Este es el dataset en formato textual separado por tabulaciones.
Recursos gráficos: se usa la visualización de un grafo en el que los nodos son los blogs y sus enlaces los arcos. Se realizarán distintos layauts según la necesidad de análisis y se establece una simbología basada en:
El color: se utiliza el color para clasificar los distintos nodos. Por ejemplo se aplica el color para distinguir con que celeridad se han apuntado los blogs a la campaña o qué blogs tienen usuario Twitter y cuales no.
Tamaño: se aplican distintos tamaños a los nodos según su importancia dentro del grafo. Uno de los criterios de importancia es el número de enlaces entrantes que tiene cada blog, lo que permite identificar visualmente cuales son los hubs de esta red.
En este caso se ha usado la herramienta java Gephi, que es muy adecuada por sus features para visualizar redes de cierto tamaño. El formato de entrada a la herramienta es gexf que incluye el tiempo como atributo para poder realizar visualizaciones dinámicas, aunque aún no han liberado esa funcionalidad. ¡¡¡¡Estoy expectante de que lo hagan!!!!
Para los más curiosos dejo los datos de entrada para Gephi para que puedan ver con sus propios ojos cómo funciona la herramienta:
Se han generado dos visualizaciones
Genérico: con sólo los nombres de los hubs para facilitar una visualización en pequeño tamaño. Fichero con los datos gexf y proyecto para cargar en gephi
Detallado: con los nombres de todos los blogs para poder navegar el grafo haciendo zoom y viendo todos los detalles de los nodos. Fichero con los datos gexf y proyecto para cargar en gephi
El zoom en Gephi se controla con la rueda del ratón.