Busca las diferencias en estos treemaps, ha transcurrido entre ellos UN AÑO de la era Twitter.
Archive for junio, 2011
La semana pasada asistí en el MediaLab–Prado a una reunión del centro de documentación 15-M. Esta iniciativa ha nacido en la acampada de la Puerta del Sol y tiene por objetivo preservar la información generada durante el movimiento 15-M, tanto el archivo físico como el digital. En la reunión se aportaron ideas para definir los procedimientos para la recogida, almacenaje y catalogación de la información. El objetivo final es crear un archivo de acceso libre a todos los ciudadanos para un uso sin restricciones.
La colección de tweets del 15-M que estoy recogiendo desde el 13 de Mayo no se puede compartir por los términos de uso del API de Tweet, Sin embargo, estos tweets contienen un gran porcentaje de enlaces que pueden ser extraídos y compartidos. Además, es posible realizar su catalogación en función del tipo de Website al que pertenecen y valorar su relevancia por el número menciones en el conjunto de tweets. Una vez realizada la clasificación de los enlaces para el archivo digital del centro de documentación 15-M, he pensado que sería una buena idea representarlos en la siguiente visualización interactiva con un layout de treemap.
El primer nivel del la visualización contiene una división por categorías en el que el tamaño es proporcional al número de menciones recibidas. Cada una de estas divisiones está subdividida en casillas que se corresponden con sitios Web y cuyo tamaño también es proporcional al número de citas.
La interactividad se puede realizar bien pasando el ratón por una casilla y se obtendrá el nombre del Website o realizando una búsqueda en la entrada de datos situada en parte inferior de la visualización, en cuyo caso se iluminaran los datos seleccionados y en la parte superior derecha aparecerá el número de Websites y de menciones de la información seleccionada.
Metodología:
- 1.500.000 de tweets recogidos desde el 13 de mayo al 6 de junio de 2011 con el Streaming API de Twitter
- Clasificación manual en categorías de los Websites más relevantes que corresponden al 80% de los enlaces. La clasificación se realiza por el dominio principal de la url por lo que si algún medio ha subido fotografías o vídeos a servidores que no son de su dominio no se catalogan como medio
- Generación de los datos para visualizar agregando los enlaces por Websites catalogados
- Utilización de la librería protovis y un diseño realizado por Ana Belén García Parra para el curso de visualización de Camon
El código fuente disponible aquí









