Cuando se investiga lo que ocurrió en Belén hace 2010 años, se encuentra que eltrending topic fue un niño llamado Jesús que nació en un establo y que dormía plácidamente en un pesebre acompañado de su madre María, de José, de un buey y una mula. Un ángeltwiteó el acontecimiento y todos los habitantes de Belén corrieron a conocer al niño. Una estrella que leyó el tweet del ángel hizo un RT que llegó al TL de los Reyes Magos de Oriente y éstos se pusieron en marcha para llevarle presentes al niño. Mientras, desde la fortaleza romana, Herodes escuchaba lo que se hablaba en Belén.
@Congosto, como no, capturó los tweets y este es el resultado visual
El EBE es uno de mis eventos favoritos. Es el lugar donde han tenido lugar más desvirtualizaciones y en el que los organizadores, José Luis Antúnez (@jlantunez), Benito Castro (@benitocastro) y Luis Rull (@luisrull) crean una atmósfera tal, que uno piensa que todo el mundo es bloguero. Estuve allí en el 2007 y no he repetido por falta de tiempo, no por falta ganas y espero asistir el año que viene.
No hay evento mejor para averiguar quién pulula por el centro de la blogosfera de España. Para ello se ha realizado un grafo de las menciones en Twitter entre los asistentes presenciales y presuntúales (término creado por Fernando Sáez Vacas). La siguiente imagen muestra el zoom del grafo que desvela los blogueros más centrales.
El tamaño de los nodos depende del número de menciones obtenidas y realizadas (Degree)
Código de colores:
Rojo= Usuarios que pertenecen al grupo de los 50 más mencionados y los 50 más activos twiteando,
Verde= Usuarios que están entre los 50 más mencionados,
Azul oscuro= Los 50 usuarios que más han twiteado.
Azul twitter= Resto de los usuarios.
El grafo general del EBE desvela que hay más conversación en la periferia que en el grafo de FICOD
También se puede apreciar cómo cambia la tonalidad del grafo si se representa el color en función del número de followers
Código de color según número de seguidores:
Gris claro=entre 0 y 9 .
Amarillo= entre 10 y 99.
Verde= entre 100 y 999.
Azul= entre 1000 y 9.999.
Morado= entre 10.000 y 99.999.
Rojo= entre 100.000 y 1.000.000.
Y como no, ¿cuál es el color predominante de los nodos más centrales según el número de seguidores?
Finalmente, ¿quién no siente curiosidad por saber cómo son las relaciones entre los blogueros más populares y los mas participativos?
El código de color utilizado es:
Rojo= entre los más mencionados y los más activos,
Verde= Entre los más mencionados,
Azul oscuro= Los más activos twiteando
El tamaño de los grafos difiere según la medida de la relevancia
Se recogieron 43.854 tweets de 7.370 usuarios distintos que dieron lugar a 30.905 menciones a 7.896 usuarios.
Los tweets fueron recogidos con una aplicación propia usando el Streaming API de Twitter desde 12 de noviembre de 2010 a las 19:40:57 hasta el 21 de noviembre a las 23:15:31
monitorizando los hashtags #EBE, #EBE10, #EBE2010
El grafo se ha generado con una herramienta propia
Las visualizaciones se han realizado con la aplicación Gephi
La relevancia de Twitter es cada vez mayor en los eventos, tanto para los organizadores como para los asistentes. Para los organizadores es una canal de comunicación directo con los asistentes y a éstos les permite sentirse integrados dentro del evento y conocer todo lo que ocurre dentro de él en tiempo real.
Los asistentes no son solo los presenciales, también hay que incluir a los presentuales(término creado por Fernando Sáez Vacas) que siguen las conferencias por streaming y se comunican vía Twitter con el resto de asistentes. Mientras transcurre el evento se intensifican los tweets entre usuarios que ya se conocían, se establecen nuevas conexiones y sobre todo se opina y se difunden las opiniones de otros.
Todo evento tiene asociado su hashtag oficial para aglutinar la conversación que fluye entre los asistentes y hacerla visible a todos los interesados. Gracias a los hashtags oficiales es posible recolectar con bastante precisión los tweets del evento.
Me pareció muy interesante analizar la conversación intensa de estos eventos y realizar una comparación entre ellos. Empecé por el FICOD y en este post muestro los primeros resultados correspondientes a la red que se forma con las menciones de unos usuarios a otros.
Red de menciones, color por relevancia
Tamaño de los nodos según el número de menciones obtenidas y realizadas (Degree)
Código de colores:
Rojo= Usuarios que pertenecen al grupo de los 50 más mencionados y los 50 más activos twiteando,
Verde= Usuarios que están entre los 50 más mencionados,
Azul oscuro= Los 50 usuarios que más han twiteado
Azul twitter= Resto de los usuarios
Zoom del centro de la red, color por relevancia
Red de menciones, color por seguidores
Tamaño de los nodos según el número de menciones obtenidas y realizadas (Degree)
Código de color según número de seguidores:
Gris claro=entre 0 y 9 .
Amarillo= entre 10 y 99
Verde= entre 100 y 999
Azul= entre 1000 y 9.999
Morado= entre 10.000 y 99.999
Rojo= entre 100.000 y 1.000.000
Zoom del centro de la red, color por seguidores
Red de los 50 usuarios más activos y los 50 más mencionados
Se ha seleccionado los usuarios más destacados entre los 50 más mencionados y los 50 más activos twiteando, algunos de ellos pertenecen a ambos grupos. Las relaciones de los grafos que se muestran a continuación son las menciones entre estos usuarios. Por tanto, muestran el grado de relación de los nodos más relevantes. El código de color utilizado es:
Rojo= entre los más mencionados y los más activos,
Verde= Entre los más mencionados,
Azul oscuro= Los más activos twiteando
El tamaño de los grafos difiere según la medida de la relevancia
Tamaño de los nodos según menciones recibidas (In-degree)
Tamaño de los nodos según número de menciones realizadas (Out_degree)
Tamaño de los nodos según el número de menciones recibidas y realizadas (Degree)
Datos de interés
Se recogieron 25.135 tweets de 5.503 usuarios distintos que dieron lugar a 15.738 menciones de 5.238 usuarios.
Los tweets fueron recogidos con una aplicación propia usando el Streaming API de Twitter desde 13 de noviembre de 2010 a las 09:48:04 hasta el 18 de noviembre de a las 23:58:19 monitorizando los hashtags #FICOD, #FICOD10, #FICOD2010
El grafo se ha generado con una herramienta propia
Las visualizaciones se han realizado con la aplicación Gephi
El taller de visualización en javascript lo impartió Ana Belén García Parra y durante el mismo se mostró el proceso para realizar visualizaciones con Google API y Protovis. Como se puede apreciar en los ejemplos utilizados y cuyos resultados se exponen a continuación, tanto el aspecto como la interactividad conseguidos resultan muy atractivos, teniendo en cuenta la poca programación que requieren.
En el wiki del taller de visualización está disponible la presentación realizada, la grabación de la ponente, el código que se ha utilizado para mostrar los ejemplos y los resultados finales. Espero que después de este taller más de uno pierda el miedo al javascript y pronto empiece a programar sus visualizaciones.
A continuación se muestran los resultados del taller. Primero las visualizaciones realizadas con Google API y a continuación las efectuadas con Protovis. El dataset utilizado contiene los tweets recogidos en el último campeonato del mundo de baloncesto de Turquía (Turkey2010).
Al final del post se ha incrustado la presentación efectuada por Ana Belén.
Google API
Visualización con Motion chart
Para confeccionar la muestra de datos se han escogido a España y a los cuatro países que llegaron a semifinales. Para cada partido jugado en un mismo día se representa en un eje de coordenadas la relación entre los resultados y las menciones obtenidas por cada equipo mediante un círculo. Sobre el eje x se epresenta el número de menciones contabilizadas de cada país y sobre el eje y el número de puntos anotados por ese país en cada partido.
Interactividad: Se puede elegir el color y el tamaño de los círculos, seleccionar o deseleccionar países, dejar rastro o no de la trayectoria y avanzar/retroceder en el tiempo. Pasando el ratón por cada círculo aparece el país al que corresponde.
Visualización con Annotated timeline
Este gráfico muestra el número de menciones de cada país en el tiempo. La unidad adoptada para expresar la granularidad del dato es de una hora (La referencia horaria es GMT) Interactividad: Se puede modificar la escala temporal para ver la información con más detalle y avanzar o retroceder en el tiempo con la ayuda de la barra inferior.
Visualización con Treemap
Esta visualización muestra las menciones que ha tenido cada uno de los jugadores de cada país. Interactividad: Pulsando en cada país aparece un nuevo treemap con el detalle de las menciones de sus jugadores. Para volver a la visualización inicial se debe hacer doble click en el botón derecho del ratón.
Protovis
Visualización con Treemap
Al igual que el treemap del Google API, esta visualización muestra las menciones que ha tenido cada jugador de cada país, pero con otra interactividad. En la parte superior derecha aparece la siguiente información numérica asociada a la visualización: Nº de jugadores, nº de menciones y porcentaje de los datos mostrados. Interactividad: En la parte inferior izquierda permite realizar búsquedas, tanto por países como por jugadores tecleando el nombre. Conforme se escribe se van adaptando los colores del treemap para resaltar el dato buscado a la vez que se actualiza la información numérica de la parte superior derecha.
Visualización con Bubble
Con el mismo código de color por país que el anterior treemap se muestran las menciones de todos los jugadores a la vez con una colocación aleatoria, representadas por una burbuja cuyo tamaño es proporcional al número de veces en que fueron citados. Interactividad: Pasando el ratón por cada burbuja indica el nombre del jugador, el país al que pertenece y el número de menciones que ha obtenido.
Los días 2º y 3º del taller se han dedicado a la visualiziación de redes. Se han realizado prácticas con las herramientas Graphviz, Pajek, Gephi y Touchgraph. Cada una de ellas se puede encuadrar entre dos páramentos: la potencia de visualización y la ayuda para el análisis. Esta clasificación se puede ver en el gráfico anteriory puede dar una idea sobre cúal es la herramienta que mejor se adapta a la necesidad de cada uno.