arquitectura
Explorando el camino del XHTML
17 jul
Los errores sintácticos han sido uno de los problemas que me he encontrado al analizar el código HTML de los blogs con el programa Lestat, como ya escribí hace tiempo en el post titulado El diablo cojuelo. Hace unas semanas Norberto Fernández, profesor de mi Departamento me sugirió que convirtiese el HTML de los blogs a XHTML y me indicó dos herramientas para hacerlo: tidy y html2xhtml.
Estas herramientas son capaces de convertir HTML en XHTML, ordenando, limpiando y corrigiendo los errores de markup. Las ventajas de trabajar con XHTML son múltiples: es un lenguaje de marcas bien estructurado, permite de recorrer el documento con XPATH o con XSLT.
La herramienta tidy, disponible en lenguaje c y java, fue desarrollada por Dave Raggett y como dice su autor:
Is an open source utility for tidying up HTML. Tidy is composed from an HTML parser and an HTML pretty printer. The parser goes to considerable lengths to correct common markup errors. It also provides advice on how to make your pages more accessible to people with disabilities, and can be used to convert HTML content into XML as XHTML. Tidy is W3C open source and available free. It has been successfully compiled on a large number of platforms, Más >
Acuerdo en la UPM
9 jul
El jueves 26 de junio me reuní en la UPM con un profesor y dos alumnos que están realizando proyectos fin de carrera sobre la blogosfera. Después de una hora de divagaciones de repente nos entro la sensatez, empezamos a hablar de cosas concretas y comenzamos a atar cabos. Fruto de esta repentina iluminación fue el compromiso de colaborar entre todos para que nuestros trabajos se comunicaran e ir construyendo una plataforma de herramientas de supervisión de los blogs.
Barriblog tiene por objetivo el descubrimiento de blogs, su caracterización , el análisis de las relaciones de vecindad y su representación gráfica. Todo el trabajo de extraer información en crudo de las páginas HTML (nada trivial), el descubrimiento y caracterización de blogs serviría para alimentar a un explorador de los feed de post y comentarios que va a realizar otro alumno. Por otra parte otro proyecto fin de carrera está trabajando en visualización y aportaría toda su experiencia a esta plataforma.
Un magnífica colaboración sellada con una coca- cola light en el bar de la Eskuel@ (debía ser cerveza, ya lo sé)
Hoy por fin he terminado una presentación de lo que podría ser esta plataforma. La suma de muchos esfuerzos individuales que Más >

Esta es la bitácora de M. Luz Congosto que he creado para recoger los avatares de esa aventura que se llama Doctorado. Soy una tesista en la Universidad Carlos III, descubriendo barrios de blogs






