Posts Tagged ‘recortes’

Propagación de tijerasNO, Parte II

No Comments »

Continuación del post Propagación de tijerasNO, parte I

Experimento completo en BarriBlog Wiki

En este post visualiza la segunda cuestión del experimento: ¿Cómo fue la propagación? Para ello he tenido que recurrir a herramientas que permitan cierta interactividad y no he encontrado ninguna que me haya convencido al 100%, por lo que muestro dos visualizaciones en distintas herramientas. Se han utilizado SoNIA y Pajek, ambas permiten visualizaciones teniendo en cuenta la evolución en el tiempo.

Visualización con SoNIA

Layout circular con los enlaces invisibles para resaltar los nombres de los Hubs

.

Propagación de la campaña TijerasNO en los blogs. Layout circular from M. Luz Congosto on Vimeo.

.

Visualización con Pajek

Layout Fruchterman-Reingold ajustado manualmente.

.
.

Propagación blogs de TijerasNO. Layout Fruchterman-Reingold from M. Luz Congosto on Vimeo.

.

El código de color es el mismo que se utilizó en la visualización del post anterior:
• Verde los adheridos antes del día D (7 de octubre)
• Rojo los adheridos el día D,
• Azul los adheridos después del día D

El tamaño de los nodos es directamente proporcional al número de enlaces entrantes, por tanto los de mayor tamaño son los hubs.

Como se observa en ambas visualizaciones, en la propagación de los tres primeros días, del 2 al 5 de octubre, participan la mayoría de los Hubs, durante los dos días siguientes ningún Hub se hace eco. El día D, el 7 de octubre, un Hub y bastante blogs poco conectados se apuntan a la campaña, posiblemente debido a la repercusión del evento en medios externos a la blogosfera. Después de la campaña la propagación se apaga lentamente aunque el día  9 de octubre aparece un Hub tardío.

Datos de entrada a las herramientas:


Buscando los blogs que no amaban los recortes en la Ciencia

9 Comments »

Conocí la iniciativa La ciencia en España no necesita tijeras y al seguir su evolución el día 7 de octubre  pude ver  el fuerte respaldo que alcanzó. Enseguida se me pasó por la cabeza averiguar cuál sería el barrio de blogs que no amaban los recortes en la ciencia y me puse manos a la obra.

La siguiente imagen es el tag cloud de los títulos de los 794 795 posts que se escribieron para la campaña en la que participaron 898 899 blogs, entre ellos el mío.

la-ciencia-no-necesita-tijeras

Para buscar este barrio de blogs tuve que realizar algunas tareas automáticas y otras manuales. Siempre luchado contra el paso del tiempo que entierra los post en el subsuelo de las homepages y complica la búsqueda. Estos son las pasos que seguí para descubrir los blogs.

1. Fuentes  existentes de la información

  1. Comentarios del post de la convocatoria: La forma de apuntarse a la iniciativa era dejar un comentario en el post de la convocatoria indicando el blog que se adhería.
  2. Lista de los primeros 650 blogs:  El blog que lanzó la campaña confeccionó la primera lista con 650 Blogs.
  3. Web Cienciastijeras:  Después de esta primera recopilación se siguieron apuntando más blogs y se pidieron colaboradores para seguir anotándolos, esta web recogió todos los blogs que apoyaban la campaña.

2. Fuentes usadas

  • Para la lista de los posts publicados

  • Lista de los primeros 650 blogs: se obtuvieron fácilmente las urls de esta lista.
  • Comentarios del post de la convocatoria: se extrajeron las urls de los blogs que no estaban en la lista anterior
  • Fuentes usadas para las visualizaciones

  • Comentarios del post de la convocatoria: se extrajeron las 1012 urls de los blogs que dejaron su comentario junto con su fecha y hora para poder realizar timelines. En las visualizaciones están excluidos los blogs que no dejaron comentario en el post de la convocatoria aunque estuvieran en la lista de La Aldea Irreductible por no tener certeza de su timestamp.

3. Verificación de la información y filtrado de errores

  • Corrección de errores de sintaxis de las urls
  • Conversión de urls cortas a su nombre real.
  • Normalización de la url de la página principal.
  • Eliminación de urls repetidas
  • Descarte de  las urls que no eran blogs: fickr, youtube, linkedin,etc..

4. Herramientas de obtención del Barrios de blogs

  • Lestat: Se utilizó una versión reducida para analizar solo la página principal obteniendo de cada blog:
  • Lista de los enlaces internos y externos clasificados según el contexto del blog: Cabecera, lateral, post, pié de post, archivo de históricos y pie de blog.e
  • Lista de las  urls de los feeds
  • Lista de las urls que podrían pertenecer al blogroll
  • Lista de las urls de usuarios twitter
  • Posproceso de la información generada por lestat
  • Obtención de los enlaces salientes pertenecientes al conjunto de blogs estudiado
  • Obtención del post escrito para la campaña.  Al no estar familiarizada con una herramienta de parseo de feeds, por razones de tiempo los post se obtuvieron analizando las urls del código html. Para los siguientes experimentos se considera imprescindible poder analizar feeds.

5. Revisión de los resultados y corrección manual de los errores

  • Resolver problemas con los caracteres de más de 7 bits ( acentos, ñ, etc..)
  • Completar las urls de los posts que no habían sido encontradas por:
  • No estar ya en la página principal
  • No haberse publicado. Algunos blogs pusieron el logo de la campaña pero no escribieron el post
  • No contener en la url el título del post. Los blogs de Blogia y algunos WordPress codifican el enlace de las entradas con un código numérico.
  • No estar accesibles por: ser privados, tener control de acceso para adultos o  estar temporalmente fuera de servicio.

Resultados de esta primera fase:

  • Lista de blogs con el enlace al post publicado para la campaña, accesible en esta página.
  • Data set obtenido en formato xls.

Siguientes pasos a seguir:

  • Visualizar las relaciones de los blogs que han participado en la campaña, a ser posible de forma dinámica para ver como se ha propagado la iniciativa.
  • Obtención de la correspondencia blog-twitter para visualizar las relaciones de estos blogs en twitter
  • Obtención de conclusiones sobre la propagación de la campaña.
Related Posts Plugin for WordPress, Blogger...