Documentos 15-M

La semana pasada asistí en el MediaLab–Prado a una reunión del centro de documentación 15-M. Esta iniciativa ha nacido en la acampada de la Puerta del Sol y tiene por objetivo preservar la información generada durante el movimiento 15-M, tanto el archivo físico como el digital. En la reunión se aportaron ideas para definir los procedimientos para la recogida, almacenaje y catalogación de la información. El objetivo final es crear un archivo de acceso libre a todos los ciudadanos para un uso sin restricciones. La colección de tweets del 15-M que estoy recogiendo desde el 13 de Mayo no se puede compartir por los términos de uso del API de Tweet, Sin embargo, estos tweets contienen un gran porcentaje de enlaces que pueden ser extraídos y compartidos. Además, es posible realizar su catalogación en función del tipo de Website al que pertenecen y valorar su relevancia por el número menciones en el conjunto de tweets. Una vez realizada la clasificación de los enlaces para el archivo digital del centro de documentación 15-M, he pensado que sería una buena idea representarlos en la siguiente visualización interactiva con un layout de treemap. El primer nivel del la visualización contiene una división por categorías en el que el tamaño es proporcional al número de menciones recibidas. Cada una de estas divisiones está subdividida en casillas que se corresponden con sitios Web y cuyo tamaño también es proporcional al número de citas. La interactividad se puede realizar bien pasando el ratón por una casilla y se obtendrá el nombre del Website o realizando una búsqueda en la entrada de datos situada en parte inferior de la visualización, en cuyo caso se iluminaran los datos seleccionados y en la parte superior derecha aparecerá el número de Websites y de menciones de la información seleccionada.

Metodología:

  1. 1.500.000 de tweets recogidos desde el 13 de mayo al 6 de junio de 2011 con el Streaming API de Twitter
  2. Clasificación manual en categorías de los Websites más relevantes que corresponden al 80% de los enlaces. La clasificación se realiza por el dominio principal de la url por lo que si algún medio ha subido fotografías o vídeos a servidores que no son de su dominio no se catalogan como medio
  3. Generación de los datos para visualizar agregando los enlaces por Websites catalogados
  4. Utilización de la librería protovis y un diseño realizado por Ana Belén García Parra para el curso de visualización de Camon

El código fuente disponible aquí

Si te ha gustado, ¡compártelo!Share on FacebookTweet about this on TwitterShare on LinkedInShare on Google+

You may also like...

3 Responses

  1. Riva dice:

    Si lo que yo diga… trabajo de chinos xD. A ver si puedo ir al próximo tweers&beersuc3m y te pregunto un poco más sobre ello :)

  2. La clasificación la hice a mano y opté por el criterio de clasificar dominios y algunos sub dominios para que machearan más fácilmente con las urls.
    algunos subdominios los clasifique en audio, video, streaming o medios, como la rtve o Antena3
    Tambien separé las urls de movil y fijo porque me interesa conocer el porcentaje.
    Se podría unificar los que llevan las www y los que no lo llevan y los subdominios de la misma categoría, pero me suponía dar otra vuelta al script y el tiempo no es lo que mas me sobra.

  3. Riva dice:

    me parece muy interesante la clasificación aunque en el apartado de medios aparecen como medios distintos (o retículas distintas) subdominios del mismo medio… y lo mismo en servicios.
    No sé, parece que eso hace que la información sea un poco confusa. Aunque claro hay cosas que no tienen una frontera clara porque, por ejemplo, las retransmisiones en directo de rtve o a3 donde ponerlas ¿en medios o en streaming?.
    De todas maneras, me parece un gran trabajo (y de chinos… dicho sea de paso)

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *