Doctorandas 2.0

suenos.jpg

La semana pasada intercambiamos experiencias doctorales Tiscar y yo. Ella lleva mucho tiempo analizando cual es el alma de los blogs y yo acabo de empezar a buscar dónde está la yugular de las bitácoras para succionar todo lo que pueda automáticamente clavando unos colmillos parserdianos.

Ambas tenemos visiones diferentes, ella busca la esencia, yo el automatismo. Pero todo tiene su punto de encuentro y parte del aura de los blogs puede ser extraída con un poco de maña e imaginación.

Con alevosía y nocturnidad escribo este post una vez que he actualizado el modelo de datos con parte de la esencia de blogs que ha descubierto Tiscar. Desde aquí le quiero dar las gracias porque en poco tiempo he podido completar más que satisfactoriamente el modelo de datos.

Pero la noche, siempre nos hace darle vueltas a las cosas y me asalta la duda que tanto esfuerzo de extracción de información me llevará a conclusiones virtuales. En la blogosfera reina el seudónimo bajo el cual se distorsiona la realidad de forma incontrolada. Se tocan los dos extremos: la cruda realidad que jamás saldría a la luz escrita bajo un el nombre real hasta la mentira que no se creería el más ingenuo.

Diferenciar la verdad de la mentira, la realidad de la fantasía me puede llevar al monólogo de Segismundo en el que reflexiona sobre la vida:

¿Qué es un blog? Un frenesí.
¿Qué es un blog? Una ilusión,
una sombra, una ficción,
y el mayor blog es pequeño:
que todos los blogs son sueños,
y los sueños, sueños son.

Me voy a dormir que no son horas :-)

Cuantitativo Vs. Cualitativo

vecinos.jpg

Cuando medimos siempre lo hacemos en base a una unidad. Con las herramientas de extracción de la información lo fácil es medir, pero ¿dónde está ese paso entre la medida y la cualidad? ¿cómo deducimos cualidades en base a unas medidas?

Me podría poner a disertar por sobre la cualidad y la cantidad pero no llegaría a nada concreto para el 15 de septiembre que tendré que defender mi trabajo. Así que tirando de la vena pragmática me asoma en casos extremos (no llego, no llego..) y de mi facilidad a poner motes, he empezado a categorizar los blogs y a pasarle esta clasificación a mis allegados para que me aporten comentarios.

Algunas cualidades se pueden extraer de las mediciones pero otras son casi imposibles de obtener con los medios que tenemos de análisis. Para estas últimas me planteé pedirle directamente los bloggers que se clasificaran ellos mismos y asunto resuelto: algoritmo humano barato, barato. Ante la frase Es muy triste pedir pero más triste es no llegar a la fecha de entrega no creo que ningún corazón de la blogosfera me negará su autodefinición.

Cuando he pasado estos pensamientos a circulación he recibido una realimentación muy interesante de Muxfin que me propone que el algoritmo de clasificación ejecutado por un humano pase a ejecutarse en human grid computing. Es decir ¿Por qué no evalúan los vecinos de un barrio a los blogs de su barrio?

Definiendo el modelo de datos

El día 12-J estuve hablando con un posible director de mi trabajo, Jose Jesús García Rueda. Me aconsejó que fuera definiendo el modelo de datos para ver que iba identificando. Esta noche con la legaña puesta me he puesto manos a la obra y he empezando a estructurar los datos con FreeMind.

Por ahora solo enseño el primer nivel, para darle emoción al asunto. To be continued…

blogs-mini.jpeg