Blogs vs. Prensa en el hashtag #manifiesto
Nunca se sabe la dificultad que entraña hacer algo hasta que no se pone una a ello. Pensé que sería trivial extraer las urls de los tweets del hashtag #manifiesto y me equivoqué de lado a lado. La mayor barrera han sido las urls acortadas que es necesario expandirlas para poder analizarlas. Este pequeño detalle implica acceder a la web (consumo masivo de tiempo) y bregar con los errores de las urls (los errores humanos y de red). El script para extraer esta información ha tardado en ejecutarse más de 12 horas y debido a los errores he tenido que lanzarlo cuatro veces. Pero la paciente labor del investigador siempre tiene su recompensa y a continuación presento el análisis de las 20.236 urls que he obtenido.
Mapa de sitios más referenciados en los tweets
(Para acceder a la visualización interactiva pulsar en la imagen)
La imagen anterior ilustra el reparto de menciones a sitios web estructurados por blogs, prensa, redes sociales, TV, video, Organizaciones,wikis, etc.. Se ha utilizado una visualización treemap que ilustra muy bien la parcelación de los sitios webs al ser el tamaño de las “parcelas“ directamente proporcional al número de referencias. Como se puede observar, hay dos grandes “fincas”: las de los blogs y la de la prensa, el resto de medios se aglutina en una tercer territorio misceláneo. El terreno de los blogs es ligeramente más extenso y está bastante uniformemente distribuido, destacando Mangas Verdes, eDans y Alt140. En el territorio de la prensa dominan cuatro latifundios El Pais, Público, ABC, 20 Minutos y El Mundo. Cabe destacar que ha circulado más información textual que multimedia.
La siguiente imagen muestra el topten de sitios mencionados En él se encuentran presentes la prensa, las redes sociales y los blogs.
(Para acceder a la visualización interactiva pulsar en la imagen)
Topten de tweets mencionados
Analizando el detalle de las 6.199 urls diferentes encontradas se observa que los mensajes que más se han difundido han sido los de los blogs, dos grupos de facebook, un vídeo de youtube, un wiki de una organización y un post de una cadena de televisión. Las noticias de los grandes medios de prensa se han difundido menos.
| Sitio | Post | N. Menciones |
| Merodeando | No cuela | 106 |
| Grupo de alicante | 100 | |
| eDans | La política del maquillaje |
91 |
| Exigimos conocer el Acuerdo Comercial Anti-Falsificación #ACTA | 88 | |
| Linotipo | El #manifiesto y la ética hácker | 88 |
| Escolar | Manifiesto: en defensa de los derechos fundamentales en Internet | 87 |
| Youtube | Sinde, pirate ya. La lección de Punset | 85 |
| Gallir | Tienen razónl a sgae, la coalicion y el ministerio de cultura | 81 |
| Wiki | Manifiestointernet.org | 75 |
| Cuatro | Los internautas y la oposición rechazan el modelo para el cierre de ‘webs | 73 |
Como curiosidad la url más mencionada http://es.twirus.com/ con 321 menciones es un servicio que twitea los hashtags más calientes y por tanto se ha excluido del ranking.
Acortadores de urls
Una característica de los tweets es el uso de acortadores de urls para optimizar el espacio de los tweets. El 82% de las urls estaban acortadas. Me he sorprendido al identificar 103 acortadores diferentes. Se observa que además de los servicios web, algunos blogs utilizan su propio sistema de reducción del tamaño de sus urls.
bit.ly destaca sobre todos los sistemas de acortar url con un 55.76% seguido de tinyurl.com con una cuota del 16.17%
(Para acceder a la visualización interactiva pulsar en la imagen. )
Conclusiones
|
Metodología usada
- Se ha utilizado el lenguaje python para extraer la información
- Se extrajeron 21.905 urls con una tasa de fallo por error de acceso al descomprimir las urls acortadas del 7,6%. El proceso de extracción duró más de 12 horas
- Se procesaron automáticamente 20.236 urls para obtener los sitios más mencionados, las urls más referenciadas y los distintos acortadores de url. Se ha realizado una revisión manual de las urls acortadas porque dieron algunos falsos positivos
El data set
- Los datos obtenidos y procesados se encuentran en esta hoja de cálculo
Enlaces relacionados:
| Imprimir artículo | Este artículo fue publicado por M.Luz Congosto el abril 14, 2010 a las 5:50 , y está archivado en Experimentos, Twitter. Sigue las respuestas a esta entrada a través de RSS 2.0. Puedes dejar un comentario o enviar un trackback desde tu propio sitio. |
Additional comments powered by BackType









Esta es la bitácora de M. Luz Congosto que he creado para recoger los avatares de esa aventura que se llama Doctorado. Soy una tesista en la Universidad Carlos III, descubriendo barrios de blogs







hace 4 meses
Interesante articulo http://bit.ly/bfS0uD quizas los datos obtenidos por @congosto d UC3M sobre #manifiesto t interesen http://bit.ly/bBLwPY
This comment was originally posted on Twitter
hace 4 meses
Hola @Yoriento , has visto estos estudios hechos por @congosto Analisis datos #Manifiesto http://bit.ly/aHSUo3 y http://bit.ly/czkNQV
This comment was originally posted on Twitter
hace 4 meses
@edans Hola Enrique, has visto estos estudios hechos por @congosto Analisis datos #Manifiesto http://bit.ly/aHSUo3 y http://bit.ly/czkNQV
This comment was originally posted on Twitter
hace 4 meses
RT @edyvidal: RT @paco229 #FF especial, con todo mi afecto y admiracion por su trabajo http://bit.ly/aHSUo3 por los analisis de #manifie …
This comment was originally posted on Twitter
hace 4 meses
RT @paco229 #FF especial, con todo mi afecto y admiracion por su trabajo http://bit.ly/aHSUo3 por los analisis de #manifiesto a @congosto
This comment was originally posted on Twitter
hace 4 meses
#FF especial y con todo el afecto y admiracion por su trabajo http://bit.ly/aHSUo3 desinteresado en los analisis de #manifiesto a @congosto
This comment was originally posted on Twitter
hace 4 meses
RT @petezin: Blogs vs. Prensa en el hashtag #manifiesto por @congosto http://bit.ly/a2eW3P
This comment was originally posted on Twitter
hace 4 meses
Blogs vs. Prensa en el hashtag #manifiesto por @congosto http://bit.ly/a2eW3P
This comment was originally posted on Twitter
hace 4 meses
RT @edyvidal: RT @paco229 Impresionante trabajo de Mariluz , merece un homenaje Twittero x este estudio http://bit.ly/aHSUo3 de #manifiesto
This comment was originally posted on Twitter
hace 4 meses
RT @paco229: @congosto Impresionante trabajo de Mariluz se merece un homenaje Twittero sentido x este estudio http://bit.ly/aHSUo3 de #m …
This comment was originally posted on Twitter
hace 4 meses
RT @paco229 Impresionante trabajo de Mariluz , merece un homenaje Twittero x este estudio http://bit.ly/aHSUo3 de #manifiesto
This comment was originally posted on Twitter
hace 4 meses
Muy muy bueno… RT @mmeida RT @zanguanga: RT @paco229 Mariluz , merece un homenaje por este estudio http://bit.ly/aHSUo3 sobre #manifiesto
This comment was originally posted on Twitter
hace 4 meses
RT @zanguanga: RT @paco229 Impresionante trabajo de Mariluz , merece un homenaje Twittero x este estudio http://bit.ly/aHSUo3 de #manifiesto
This comment was originally posted on Twitter
hace 4 meses
RT @paco229: @congosto Impresionante trabajo de Mariluz se merece un homenaje Twittero sentido x este estudio http://bit.ly/aHSUo3 de #m …
This comment was originally posted on Twitter
hace 4 meses
@congosto Impresionante trabajo de Mariluz se merece un homenaje Twittero sentido x este estudio http://bit.ly/aHSUo3 de #manifiesto @edans
This comment was originally posted on Twitter
hace 4 meses
Impresionante! Muy bueno, Mariluz RT @congosto: Nuevo en Barriblog: Blogs vs. Prensa en el hashtag #manifiesto http://bit.ly/bBLwPY
This comment was originally posted on Twitter
hace 4 meses
RT @congosto: Nuevo en Barriblog: Blogs vs. Prensa en el hashtag #manifiesto http://bit.ly/bBLwPY
This comment was originally posted on Twitter
hace 4 meses
RT @congosto Nuevo en Barriblog: Blogs vs. Prensa en el hashtag #manifiesto http://bit.ly/bBLwPY #ACTA
This comment was originally posted on Twitter
hace 4 meses
Nuevo en Barriblog: Blogs vs. Prensa en el hashtag #manifiesto http://bit.ly/bBLwPY
This comment was originally posted on Twitter
hace 4 meses
Gracias a todos los RTs
@sandopen: Ayer no pude ir al evento de Fundación porque quería terminar este análisis. Espero poder ir al próximo.
@vrruiz Gracias!! llevo programando en python dos semanas y no veas lo que cunde. Se ajusta como anillo al dedo para este tipo de análisis. ¡No sé como no lo he usado antes!
@paco229 y edyvidal Os voy a contratar de managers :-)
hace 4 meses
Magnifico trabajo, dentro de poco se te habrá olvidado el tiempo pasado con el trabajo y el resultado quedará. Me ha encantado!!!
hace 4 meses
¡Muy buen trabajo de análisis! Y usando Python, como Guido manda :)