Resultados tijeras No
De Visualizar
A principios de octubre de 2009 se lanzó una protesta contra los recortes del Gobierno de España en el presupuesto de I+D mediante este post La ciencia en España no necesita tijeras. El día 7 de octubre de 2009 más mil blogs estaban apuntados a esta iniciativa que consistía en escribir un post en su blog indicando una razón por la que no se debería recortar el presupuesto de I+D.
Participé en la campaña e inicié un experimento para visualizar cómo se ha propagado en la red. Enseguida se me pasó por la cabeza averiguar cuál sería el barrio de blogs que no amaban los recortes en la ciencia y cómo serían sus relaciones. Me puse manos a la obra para analizar los 1012 blogs, que apoyaron la campaña, entre ellos el mío.
La movilización a favor de la Ciencia y la rápida propagación de la campaña despertó mi curiosidad asaltándome una serie de preguntas que han sido la motivación que me ha llevado a recoger los datos de los participantes en la campaña para analizarlos.
Con este experimento se intentará responder a las preguntas:
- ¿Qué relación existe entre los blogs que han participado en la campaña de la campaña?
- ¿Cómo fue la propagación?
- ¿Influyó Twitter en la propagación?
Tabla de contenidos |
¿Qué relación existe entre los blogs que han participado en la campaña de la campaña?
El vídeo contiene una animación de la red que forman los blogs que no amaban los recortes en la ciencia. El código de color es:
- Verde: los adheridos antes del día D (7 de octubre)
- Rojo: los adheridos el día D,
- Azul: los adheridos después del día D
El tamaño de los nodos es directamente proporcional al número de enlaces entrantes, por tanto los de mayor tamaño son los hubs.
La red tiene 1012 nodos y un núcleo pequeño bien conectado ( 36% ) y una extensa periferia sin conectar (64%). El número de enlaces entrantes de cada blog desde los blogs que participaron en la campaña sigue una power law, como se puede ver en esta visualización que se ha generado en manyeyes. El 20% de los blogs tiene más del 80% de los enlaces.
En el grafo destacan como hubs los siguientes blogs: aldea-irreductible.blogspot.com(65), escolar.net(45), paleofreak.blogalia.com ( 37),cienciakanija.com ( 35), fogonazos.blogspot.com ( 32), eumafeag.blogspot.com ( 28), fisicacf.blogspot.com (27), malaciencia.info (21), danielmarin.blogspot.com (17), biogeocarlos.blogspot.co(17).
En este caso se ha usado la herramienta java Gephi, que es muy adecuada por sus features para visualizar redes de cierto tamaño. El formato de entrada a la herramienta es gexf que incluye el tiempo como atributo para poder realizar visualizaciones dinámicas.
Para los más curiosos dejo los datos de entrada para Gephi para que puedan ver con sus propios ojos cómo funciona la herramienta:
Se han generado dos visualizaciones
- Genérico: con sólo los nombres de los 'hubs' para facilitar una visualización en pequeño tamaño. Fichero con los datos gexf y proyecto para cargar en gephi
- Detallado: con los nombres de todos los blogs para poder navegar el grafo haciendo zoom y viendo todos los detalles de los nodos. Fichero con los datos gexf y proyecto para cargar en gephi
El zoom en Gephi se controla con la rueda del ratón.
¿Cómo fue la propagación?
Para ver la propagación he tenido que recurrir a herramientas que permitan cierta interactividad y no he encontrado ninguna que me haya convencido al 100%, por lo que muestro dos visualizaciones en distintas herramientas. Se han utilizado SoNIA y Pajek, ambas permiten visualizaciones teniendo en cuenta la evolución en el tiempo.
Visualización con SoNIA
Layout circular con los enlaces invisibles para resaltar los nombres de los Hubs
Propagación de la campaña TijerasNO en los blogs. Layout circular from M. Luz Congosto on Vimeo.
Visualización con Pajek
Layout Fruchterman-Reingold ajustado manualmente.
Propagación blogs de TijerasNO. Layout Fruchterman-Reingold from M. Luz Congosto on Vimeo.
El código de color es el mismo que se utilizó en la visualización del post anterior:
- Verde los adheridos antes del día D (7 de octubre)
- Rojo los adheridos el día D,
- Azul los adheridos después del día D
El tamaño de los nodos es directamente proporcional al número de enlaces entrantes, por tanto los de mayor tamaño son los hubs.
Como se observa en ambas visualizaciones, en la propagación de los tres primeros días, del 2 al 5 de octubre, participan la mayoría de los Hubs, durante los dos días siguientes ningún Hub se hace eco. El día D, el 7 de octubre, un Hub y bastante blogs poco conectados se apuntan a la campaña, posiblemente debido a la repercusión del evento en medios externos a la blogosfera. Después de la campaña la propagación se apaga lentamente aunque el día 9 de octubre aparece un Hub tardío.
Datos de entrada a las herramientas:
- SoNIA: fichero barrio-link.son en formato .son.
- Pajek: fichero barrio-link.net en formato .net.
¿Influyó Twitter en la propagación?
Propagación de la campaña TijerasNO en Twitter y blogs from M. Luz Congosto on Vimeo.
Se ha escogido una visualización con un layout circular realizada con la herramienta SoNIA. El código de color es
- Azul twitter: para los bloggers que SI tienen usuario en Twitter
- Negro: para los que NO tienen usuario Twitter
El tamaño de los nodos es directamente proporcional al número de enlaces entrantes al blog, por tanto los de mayor tamaño son los hubs.
Como se observa en la visualización en las primeras horas del inicio de la campaña hay un conjunto de blogs que tiene dos características: son hubs y tienen usuario Twitter. El resto de la campaña se propagó por blogs que en su mayoría no tienen usuario Twitter.
Llama la atención el escaso número de bloggers partidarios de la ciencia que están en el twitterverse, lo que induce a pensar que twitter no está tan extendido como parece entre los bloggers. Conclusión
Twitter influyó al propagar la campaña rápidamente a entre blogs que tienen bastante influencia y que actuaron de detonante para extender la campaña en la blogoesfera que se comportó como una lenta mecha que dio lugar a la publicación de más de mil posts el día 7 de octubre y cuya repercusión saltó a otros medios de comunicación.
Twitter y los blogs son dos medios diferentes que se complementan y se necesitan para la propagación de campañas.
Datos de entrada a la herramienta:
- SoNIA: fichero barrio-link-twitter.son en formato .son.
Metodología
Para buscar este barrio de blogs tuve que realizar algunas tareas automáticas y otras manuales. Siempre luchado contra el paso del tiempo que entierra los post en el subsuelo de las homepages y complica la búsqueda. Estos son las pasos que seguí para descubrir los blogs.
Data set
- Fuentes existentes de la información
- Comentarios del post de la convocatoria: La forma de apuntarse a la iniciativa era dejar un comentario en el post de la convocatoria indicando el blog que se adhería.
- Lista de los primeros 650 blogs: El blog que lanzó la campaña confeccionó la primera lista con 650 Blogs.
- Web Cienciastijeras: Después de esta primera recopilación se siguieron apuntando más blogs y se pidieron colaboradores para seguir anotándolos, esta web recogió todos los blogs que apoyaban la campaña.
- Fuentes usadas
- Lista de los primeros 650 blogs: se obtuvieron fácilmente las urls de esta lista.#
- Comentarios del post de la convocatoria: se extrajeron las urls de los blogs que no estaban en la lista anterior.
Se descartó la tercera fuente por no tener las urls accesibles en el código fuente de la página. Se utilizaron las dos primeras fuentes para extraer los posts de la campaña. Para las visualizaciones solo se utilizaron los comentarios post de la convocatoria del que se extrajeron las 1012 urls de los blogs que dejaron su comentario junto con su fecha y hora para poder realizar timelines y se excluyeron los blogs que no dejaron comentario en el post de la convocatoria aunque estuvieran en la lista de La Aldea Irreductible por no tener certeza de su timestamp.
Estos datos se han transformado con la herramienta lestat para calcular los enlaces entre los blogs Este es el dataset en formato textual separado por tabulaciones.
Proceso de obtención del Data set
- Verificación de la información y filtrado de errores
- Corrección de errores de sintaxis de las urls
- Conversión de urls cortas a su nombre real.
- Normalización de la url de la página principal.
- Eliminación de urls repetidas
- Descarte de las urls que no eran blogs: fickr, youtube, linkedin,etc..
- Herramientas de obtención del Barrios de blogs
- Lestat: Se utilizó una versión reducida para analizar solo la página principal obteniendo de cada blog:
- Lista de los enlaces internos y externos clasificados según el contexto del blog: Cabecera, lateral, post, pié de post, archivo de históricos y pie de blog.e
- Lista de las urls de los feeds
- Lista de las urls que podrían pertenecer al blogroll
- Lista de las urls de usuarios twitter
- Posproceso de la información generada por lestat
- Obtención de los enlaces salientes pertenecientes al conjunto de blogs estudiado
- Obtención del post escrito para la campaña. Al no estar familiarizada con una herramienta de parseo de feeds, por razones de tiempo los post se obtuvieron analizando las urls del código html. Para los siguientes experimentos se considera imprescindible poder analizar feeds.
- Lestat: Se utilizó una versión reducida para analizar solo la página principal obteniendo de cada blog:
- Revisión de los resultados y corrección manual de los errores
- Resolver problemas con los caracteres de más de 7 bits ( acentos, ñ, etc..)
- Completar las urls de los posts que no habían sido encontradas por:
- No estar ya en la página principal
- No haberse publicado. Algunos blogs pusieron el logo de la campaña pero no escribieron el post
- No contener en la url el título del post. Los blogs de Blogia y algunos WordPress codifican el enlace de las entradas con un código numérico.
- No estar accesibles por: ser privados, tener control de acceso para adultos o estar temporalmente fuera de servicio.
Recursos Gráficos
La información se representa mediante un grafo en el que los nodos son los blogs y sus enlaces los arcos. Se realizarán distintos layauts según la necesidad de análisis y se establece una simbología basada en:
- El color: se utiliza el color para clasificar los distintos nodos. Por ejemplo se aplica el color para distinguir con que celeridad se han apuntado los blogs a la campaña o qué blogs tienen usuario Twitter y cuales no.
- Tamaño: se aplicarán distintos tamaños a los nodos según su importancia dentro del grafo. Uno de los criterios de importancia es el número de enlaces entrantes que tiene cada blog, lo que permite identificar visualmente cuales son los 'hubs' de esta red.
Herramientas de visualización
Se utilizan Pajek, SoNIA y Gephi
APENDICE I: Lista de los blogs que no amaban los recortes en la ciencia
Para esta lista se han utilizado las siguientes fuentes:
- Lista de los primeros 650 blogs que publicó el blogs de La aldea irreductible
- Comentarios del post de la convocatoria del que se extrajeron las urls de los blogs que no estaban en la lista anterior.
Esta lista no se corresponde exactamente con la lista utilizada en la visualización porque la lista de los 650 blogs que publicó la aldea irreductible contenía blogs que no se había apuntado en el post de la convocatoria, posiblemente porque contactaron con la aldea irreductible por otros medios (twitter, email,etc..) Para las visualizaciones solo se utilizaron los comentarios del post de la convocatoria del que se extrajeron las 1012 urls de los blogs que dejaron su comentario junto con su fecha y hora para poder realizar timelines. timestamp.
Lista de los post de la campaña

