La semana pasada asistí en el MediaLab–Prado a una reunión del centro de documentación 15-M. Esta iniciativa ha nacido en la acampada de la Puerta del Sol y tiene por objetivo preservar la información generada durante el movimiento 15-M, tanto el archivo físico como el digital. En la reunión se aportaron ideas para definir los procedimientos para la recogida, almacenaje y catalogación de la información. El objetivo final es crear un archivo de acceso libre a todos los ciudadanos para un uso sin restricciones.
La colección de tweets del 15-M que estoy recogiendo desde el 13 de Mayo no se puede compartir por los términos de uso del API de Tweet, Sin embargo, estos tweets contienen un gran porcentaje de enlaces que pueden ser extraídos y compartidos. Además, es posible realizar su catalogación en función del tipo de Website al que pertenecen y valorar su relevancia por el número menciones en el conjunto de tweets. Una vez realizada la clasificación de los enlaces para el archivo digital del centro de documentación 15-M, he pensado que sería una buena idea representarlos en la siguiente visualización interactiva con un layout de treemap.
El primer nivel del la visualización contiene una división por categorías en el que el tamaño es proporcional al número de menciones recibidas. Cada una de estas divisiones está subdividida en casillas que se corresponden con sitios Web y cuyo tamaño también es proporcional al número de citas.
La interactividad se puede realizar bien pasando el ratón por una casilla y se obtendrá el nombre del Website o realizando una búsqueda en la entrada de datos situada en parte inferior de la visualización, en cuyo caso se iluminaran los datos seleccionados y en la parte superior derecha aparecerá el número de Websites y de menciones de la información seleccionada.
Metodología:
1.500.000 de tweets recogidos desde el 13 de mayo al 6 de juniode 2011 con el Streaming API de Twitter
Clasificación manual en categorías de los Websites más relevantes que corresponden al 80% de los enlaces. La clasificación se realiza por el dominio principal de la url por lo que si algún medio ha subido fotografías o vídeos a servidores que no son de su dominio no se catalogan como medio
Generación de los datos para visualizar agregando los enlaces por Websites catalogados
El día 13 de mayo pude observar en Twitter un incremento de la difusión de las manifestaciones del 15-M convocadas por varios colectivos desde la Red. Comencé a monitorizar los hashtags#15M, #democraciarealya, #nolesvotes y #tomalacalle. Tras las manifestaciones surgió la acampada de Sol: “Unas 40 personas, después de la manifestación del 15 de mayo, decidimos espontáneamente quedarnos a dormir en la Puerta del Sol para apoyar a las que estaban detenidas y continuar con las movilizaciones” (según el blog de la acampada) .
Estas manifestaciones en toda España no tuvieron mucha repercusión en los medios, salvo en algunos online, pero La acampada de Sol dio un giro informativo y de repente pasó a ser noticia en periódicos y televisiones. Esto provocó una reacción en Twitter disparando el número de tweets con los hashtags que estaba monitorizando. He querido averiguar las palabras más frecuentes en los tweets,, la intensidad de la conversación y cuáles son los hahstagsse están imponiendo. Aquí van las respuestas:
Zumo de tweets
Frecuencia de tweets
En seis días se publicaron 983.744 tweetspor 162.397 usuarios únicos. La siguiente gráfica muestra los tweetspublicados diariamente y los usuarios únicos por día.Se aprecia una pequeña caída el día 16 que adquiere una tendencia creciente los días 17, 18 y 19 que se mantiene hasta el día 20 en que empieza a decrecer.
Esta gráfica muestra las menciones acumuladas de hashtagsque permiten observarla tendencia de crecimiento. Antes de la acampada los hashtags predominantes fueron #15m y 15mani. A partir del 15 de mayo arrancan varios hahstags nuevos como #acampadasol,#spanishrevolution, #nonosvamos,#notenemosmiedo, #yeswecamp y #acampadabcn. Pero los hashtaghs dominantes han sido #acampadasol , #spanishrevolution, #15m, #nolesvotes y #democraciarealya.
Cuando se investiga lo que ocurrió en Belén hace 2010 años, se encuentra que eltrending topic fue un niño llamado Jesús que nació en un establo y que dormía plácidamente en un pesebre acompañado de su madre María, de José, de un buey y una mula. Un ángeltwiteó el acontecimiento y todos los habitantes de Belén corrieron a conocer al niño. Una estrella que leyó el tweet del ángel hizo un RT que llegó al TL de los Reyes Magos de Oriente y éstos se pusieron en marcha para llevarle presentes al niño. Mientras, desde la fortaleza romana, Herodes escuchaba lo que se hablaba en Belén.
@Congosto, como no, capturó los tweets y este es el resultado visual
El EBE es uno de mis eventos favoritos. Es el lugar donde han tenido lugar más desvirtualizaciones y en el que los organizadores, José Luis Antúnez (@jlantunez), Benito Castro (@benitocastro) y Luis Rull (@luisrull) crean una atmósfera tal, que uno piensa que todo el mundo es bloguero. Estuve allí en el 2007 y no he repetido por falta de tiempo, no por falta ganas y espero asistir el año que viene.
No hay evento mejor para averiguar quién pulula por el centro de la blogosfera de España. Para ello se ha realizado un grafo de las menciones en Twitter entre los asistentes presenciales y presuntúales (término creado por Fernando Sáez Vacas). La siguiente imagen muestra el zoom del grafo que desvela los blogueros más centrales.
El tamaño de los nodos depende del número de menciones obtenidas y realizadas (Degree)
Código de colores:
Rojo= Usuarios que pertenecen al grupo de los 50 más mencionados y los 50 más activos twiteando,
Verde= Usuarios que están entre los 50 más mencionados,
Azul oscuro= Los 50 usuarios que más han twiteado.
Azul twitter= Resto de los usuarios.
El grafo general del EBE desvela que hay más conversación en la periferia que en el grafo de FICOD
También se puede apreciar cómo cambia la tonalidad del grafo si se representa el color en función del número de followers
Código de color según número de seguidores:
Gris claro=entre 0 y 9 .
Amarillo= entre 10 y 99.
Verde= entre 100 y 999.
Azul= entre 1000 y 9.999.
Morado= entre 10.000 y 99.999.
Rojo= entre 100.000 y 1.000.000.
Y como no, ¿cuál es el color predominante de los nodos más centrales según el número de seguidores?
Finalmente, ¿quién no siente curiosidad por saber cómo son las relaciones entre los blogueros más populares y los mas participativos?
El código de color utilizado es:
Rojo= entre los más mencionados y los más activos,
Verde= Entre los más mencionados,
Azul oscuro= Los más activos twiteando
El tamaño de los grafos difiere según la medida de la relevancia
Se recogieron 43.854 tweets de 7.370 usuarios distintos que dieron lugar a 30.905 menciones a 7.896 usuarios.
Los tweets fueron recogidos con una aplicación propia usando el Streaming API de Twitter desde 12 de noviembre de 2010 a las 19:40:57 hasta el 21 de noviembre a las 23:15:31
monitorizando los hashtags #EBE, #EBE10, #EBE2010
El grafo se ha generado con una herramienta propia
Las visualizaciones se han realizado con la aplicación Gephi
La relevancia de Twitter es cada vez mayor en los eventos, tanto para los organizadores como para los asistentes. Para los organizadores es una canal de comunicación directo con los asistentes y a éstos les permite sentirse integrados dentro del evento y conocer todo lo que ocurre dentro de él en tiempo real.
Los asistentes no son solo los presenciales, también hay que incluir a los presentuales(término creado por Fernando Sáez Vacas) que siguen las conferencias por streaming y se comunican vía Twitter con el resto de asistentes. Mientras transcurre el evento se intensifican los tweets entre usuarios que ya se conocían, se establecen nuevas conexiones y sobre todo se opina y se difunden las opiniones de otros.
Todo evento tiene asociado su hashtag oficial para aglutinar la conversación que fluye entre los asistentes y hacerla visible a todos los interesados. Gracias a los hashtags oficiales es posible recolectar con bastante precisión los tweets del evento.
Me pareció muy interesante analizar la conversación intensa de estos eventos y realizar una comparación entre ellos. Empecé por el FICOD y en este post muestro los primeros resultados correspondientes a la red que se forma con las menciones de unos usuarios a otros.
Red de menciones, color por relevancia
Tamaño de los nodos según el número de menciones obtenidas y realizadas (Degree)
Código de colores:
Rojo= Usuarios que pertenecen al grupo de los 50 más mencionados y los 50 más activos twiteando,
Verde= Usuarios que están entre los 50 más mencionados,
Azul oscuro= Los 50 usuarios que más han twiteado
Azul twitter= Resto de los usuarios
Zoom del centro de la red, color por relevancia
Red de menciones, color por seguidores
Tamaño de los nodos según el número de menciones obtenidas y realizadas (Degree)
Código de color según número de seguidores:
Gris claro=entre 0 y 9 .
Amarillo= entre 10 y 99
Verde= entre 100 y 999
Azul= entre 1000 y 9.999
Morado= entre 10.000 y 99.999
Rojo= entre 100.000 y 1.000.000
Zoom del centro de la red, color por seguidores
Red de los 50 usuarios más activos y los 50 más mencionados
Se ha seleccionado los usuarios más destacados entre los 50 más mencionados y los 50 más activos twiteando, algunos de ellos pertenecen a ambos grupos. Las relaciones de los grafos que se muestran a continuación son las menciones entre estos usuarios. Por tanto, muestran el grado de relación de los nodos más relevantes. El código de color utilizado es:
Rojo= entre los más mencionados y los más activos,
Verde= Entre los más mencionados,
Azul oscuro= Los más activos twiteando
El tamaño de los grafos difiere según la medida de la relevancia
Tamaño de los nodos según menciones recibidas (In-degree)
Tamaño de los nodos según número de menciones realizadas (Out_degree)
Tamaño de los nodos según el número de menciones recibidas y realizadas (Degree)
Datos de interés
Se recogieron 25.135 tweets de 5.503 usuarios distintos que dieron lugar a 15.738 menciones de 5.238 usuarios.
Los tweets fueron recogidos con una aplicación propia usando el Streaming API de Twitter desde 13 de noviembre de 2010 a las 09:48:04 hasta el 18 de noviembre de a las 23:58:19 monitorizando los hashtags #FICOD, #FICOD10, #FICOD2010
El grafo se ha generado con una herramienta propia
Las visualizaciones se han realizado con la aplicación Gephi