En este post visualiza la segunda cuestión del experimento: ¿Cómo fue la propagación? Para ello he tenido que recurrir a herramientas que permitan cierta interactividad y no he encontrado ninguna que me haya convencido al 100%, por lo que muestro dos visualizaciones en distintas herramientas. Se han utilizado SoNIA y Pajek, ambas permiten visualizaciones teniendo en cuenta la evolución en el tiempo.
Visualización con SoNIA
Layout circular con los enlaces invisibles para resaltar los nombres de los Hubs
El código de color es el mismo que se utilizó en la visualización del post anterior:
• Verde los adheridos antes del día D (7 de octubre)
• Rojo los adheridos el día D,
• Azul los adheridos después del día D
El tamaño de los nodos es directamente proporcional al número de enlaces entrantes, por tanto los de mayor tamaño son los hubs.
Como se observa en ambas visualizaciones, en la propagación de los tres primeros días, del 2 al 5 de octubre, participan la mayoría de los Hubs, durante los dos días siguientes ningún Hub se hace eco. El día D, el 7 de octubre, un Hub y bastante blogs poco conectados se apuntan a la campaña, posiblemente debido a la repercusión del evento en medios externos a la blogosfera. Después de la campaña la propagación se apaga lentamente aunque el día 9 de octubre aparece un Hub tardío.
Conocí la iniciativa La ciencia en España no necesita tijeras y al seguir su evolución el día 7 de octubre pude ver el fuerte respaldo que alcanzó. Enseguida se me pasó por la cabeza averiguar cuál sería el barrio de blogs que no amaban los recortes en la ciencia y me puse manos a la obra.
La siguiente imagen es el tag cloud de los títulos de los794795 posts que se escribieron para la campaña en la que participaron 898 899 blogs, entre ellos el mío.
Para buscar este barrio de blogs tuve que realizar algunas tareas automáticas y otras manuales. Siempre luchado contra el paso del tiempo que entierra los post en el subsuelo de las homepages y complica la búsqueda. Estos son las pasos que seguí para descubrir los blogs.
1. Fuentes existentes de la información
Comentarios del post de la convocatoria: La forma de apuntarse a la iniciativa era dejar un comentario en el post de la convocatoria indicando el blog que se adhería.
Lista de los primeros 650 blogs: El blog que lanzó la campaña confeccionó la primera lista con 650 Blogs.
Web Cienciastijeras: Después de esta primera recopilación se siguieron apuntando más blogs y se pidieron colaboradores para seguir anotándolos, esta web recogió todos los blogs que apoyaban la campaña.
2. Fuentes usadas
Para la lista de los posts publicados
Lista de los primeros 650 blogs: se obtuvieron fácilmente las urls de esta lista.
Comentarios del post de la convocatoria: se extrajeron las urls de los blogs que no estaban en la lista anterior
Fuentes usadas para las visualizaciones
Comentarios del post de la convocatoria: se extrajeron las 1012 urls de los blogs que dejaron su comentario junto con su fecha y hora para poder realizar timelines. En las visualizaciones están excluidos los blogs que no dejaron comentario en el post de la convocatoria aunque estuvieran en la lista de La Aldea Irreductible por no tener certeza de su timestamp.
3. Verificación de la información y filtrado de errores
Corrección de errores de sintaxis de las urls
Conversión de urls cortas a su nombre real.
Normalización de la url de la página principal.
Eliminación de urls repetidas
Descarte de las urls que no eran blogs: fickr, youtube, linkedin,etc..
4. Herramientas de obtención del Barrios de blogs
Lestat: Se utilizó una versión reducida para analizar solo la página principal obteniendo de cada blog:
Lista de los enlaces internos y externos clasificados según el contexto del blog: Cabecera, lateral, post, pié de post, archivo de históricos y pie de blog.e
Lista de las urls de los feeds
Lista de las urls que podrían pertenecer al blogroll
Lista de las urls de usuarios twitter
Posproceso de la información generada por lestat
Obtención de los enlaces salientes pertenecientes al conjunto de blogs estudiado
Obtención del post escrito para la campaña. Al no estar familiarizada con una herramienta de parseo de feeds, por razones de tiempo los post se obtuvieron analizando las urls del código html. Para los siguientes experimentos se considera imprescindible poder analizar feeds.
5. Revisión de los resultados y corrección manual de los errores
Resolver problemas con los caracteres de más de 7 bits ( acentos, ñ, etc..)
Completar las urls de los posts que no habían sido encontradas por:
No estar ya en la página principal
No haberse publicado. Algunos blogs pusieron el logo de la campaña pero no escribieron el post
No contener en la url el título del post. Los blogs de Blogia y algunos WordPress codifican el enlace de las entradas con un código numérico.
No estar accesibles por: ser privados, tener control de acceso para adultos o estar temporalmente fuera de servicio.
Resultados de esta primera fase:
Lista de blogs con el enlace al post publicado para la campaña, accesible en esta página.