Archive for the ‘Visualizaciones’ Category

Taller de visualización: Javascript

No Comments »


El taller de visualización en javascript lo impartió Ana Belén García Parra y durante el mismo se mostró el proceso para realizar visualizaciones con  Google API y Protovis.  Como se puede apreciar en los ejemplos utilizados y cuyos resultados se exponen a continuación, tanto el aspecto como la interactividad conseguidos resultan muy atractivos, teniendo en cuenta la poca programación que requieren.

En el wiki del taller de visualización está disponible la presentación realizada, la grabación de la ponente, el código que se ha utilizado para mostrar los ejemplos y los resultados finales. Espero que después de este taller más de uno pierda el miedo al javascript y pronto empiece a programar sus visualizaciones.

A continuación se muestran los resultados del taller. Primero las visualizaciones realizadas con Google API y a continuación las efectuadas con Protovis. El dataset utilizado contiene los tweets recogidos en el último campeonato del mundo de baloncesto de Turquía (Turkey2010).

Al final del post se ha incrustado la presentación efectuada por Ana Belén.

Google API

Visualización con Motion chart

Para confeccionar la muestra de datos se han escogido a España y a los cuatro países que llegaron a semifinales.  Para cada partido jugado en un mismo día se representa en un eje de coordenadas la relación entre los resultados y las menciones obtenidas por cada equipo mediante un círculo. Sobre el eje  x se epresenta el número de menciones contabilizadas de cada país y sobre el eje y el número de puntos anotados por ese país en cada partido.

Interactividad: Se puede elegir el color y el tamaño de los círculos, seleccionar o deseleccionar países, dejar rastro o no de la trayectoria y avanzar/retroceder en el tiempo. Pasando el ratón por cada círculo aparece el país al que corresponde.

Visualización con Annotated timeline

Este gráfico muestra el número de menciones de cada país en el tiempo. La unidad adoptada para expresar la granularidad del dato es de una hora (La referencia horaria es GMT)
Interactividad: Se puede modificar la escala temporal para ver la información con más detalle y avanzar o retroceder en el tiempo con la ayuda de la barra inferior.

Visualización con Treemap

Esta visualización muestra las menciones que ha tenido cada uno de los jugadores de cada país.
Interactividad: Pulsando en cada país aparece un nuevo treemap con el detalle de las menciones de sus jugadores. Para volver a la visualización inicial se debe hacer doble click en el botón derecho del ratón.

Protovis

Visualización con Treemap

Al igual que el treemap del Google API, esta visualización muestra las menciones que ha tenido cada jugador de cada país, pero con otra interactividad. En la parte superior derecha aparece la siguiente información numérica asociada a la visualización: Nº de jugadores, nº de menciones y porcentaje de los datos mostrados.
Interactividad: En la parte inferior izquierda permite realizar búsquedas, tanto por países como por jugadores tecleando el nombre. Conforme se escribe se van adaptando los colores del treemap para resaltar el dato buscado a la vez que se actualiza la información numérica de la parte superior derecha.

Visualización con Bubble

Con el mismo código de color por país que el anterior treemap se muestran las menciones de todos los jugadores a la vez con una colocación aleatoria, representadas por una burbuja cuyo tamaño es proporcional al número de veces en que fueron citados.
Interactividad: Pasando el ratón por cada burbuja indica el nombre del jugador, el país al que pertenece y el número de menciones que ha obtenido.

La presentación del curso


Taller de visualización: Redes

10 Comments »

Los días 2º y 3º del taller se han dedicado a la visualiziación de redes. Se han realizado prácticas con las herramientas Graphviz, Pajek, Gephi y Touchgraph.  Cada una de ellas se puede encuadrar entre dos páramentos: la potencia de visualización y la ayuda para el  análisis. Esta clasificación se puede ver en  el gráfico anterior y puede dar una idea sobre cúal es la herramienta que mejor se adapta a la necesidad de cada uno.

La grabación de la sesión está disponible en la web de Camon y los talleres de las distintas herramientas están accesibles en:

La presentación en Slide share


Taller de Visualización- Estado del arte y ManyEyes

5 Comments »

Actualización 20-10-20110:  La grabación de la primera jornada del Taller  disponible aquí

Ayer por la tarde nos reunimos en CAMON Madrid unos cuantos entusiastas de la visualización. Como era de esperar ha sido grupo heterogéneo que hemos llegado a la visualización desde distintas profesiones pero con similares necesidades: transmitir información, conocimiento o ideas mediante un impacto visual. El taller fue emitido en streaming por  Camon y La Información el primer medio español con una sección de visualización.

En mi caso la visualización me ayuda a analizar los datos que investigo, a validar los algoritmos y a presentar los resultados de una forma más divulgativa. Lo que he aprendido ha sido gracias a Internet y a bastantes horas de autoaprendizaje.

Este primer día de taller he presentado una visión global del estado del arte de la visualización, el data set que se va a utilizar en los talleres y he realizado algunas visualizaciones con el servicio ManyEyes.

Aquí está la presentación:

Aquí las primeras visualizaciones:

¿Quién fue más mencionado Navarro o Gasol? interactuen y vean..
¿Cuantas palabras españolas hay entre las más pronunciadas?

Agudeza visual: ¿qué dos paises se parecen más en sus menciones?
¿Cuantos twitean desde su iPhone?

¿En que lugar esta España en cuanto menciones en el Turkey2010?


Un paseo por la visualización de datos en siete días

5 Comments »

Tanto los que estén interesados en la visualización de datos como los que sientan curiosidad por ella, ya pueden ir reservando en su agenda los días 13,14, 20, 21, 26, 27 y 29 de octubre porque CAMON Madrid organiza unos talleres de entrada libre sobre visualización de datos.

El espacio de CAMON Madrid, situado en Plaza de Moncloa, 1, (acceso por calle Princesa)  es un espacio tecnológico de interacción y creación que inicia su actividad en Madrid siguiendo los pasos que su hermano mayor de Alicante.

La visualización de datos es una materia que no tiene un encuadre concreto en los espacios académicos. Tal vez por su diversidad y por su naturaleza transversal. Se ha desarrollado desde distintos frentes como ayuda al análisis de redes y sistemas complejos, como herramienta de comunicación avanzada o como expresión artística. Se ha divulgado generalmente por Internet y cada vez hay más herramientas de visualización y plataformas para desarrollar visualizaciones ad hoc.

El objetivo del taller es reunir la información sobre Visualización dispersa por Internet y poder evaluar y comparar los recursos existentes.

El taller lo impartiré junto a Ana Belén García Parra, Juan José Martín Rodríguez y Miguel Ángel Cañas Vaz y se ha estructurado en cuatro módulos:

  • Estado del arte y visualización básica: taller compuesto de teoría y una práctica con la herramienta Many Eyes. Orientado a un público general interesado en conocer lo que es la visualización. No requiere ningún conocimiento técnico previo.
  • Visualización de redes: taller eminentemente práctico sobre como realizar visualización de redes utilizando cuatro herramientas diferentes. Se explicarán los distintos formatos que utilizan las herramientas y cómo generarlos. Orientado a personas interesadas en análisis de redes. No requiere requiere conocimientos de  programación.
  • Visualización en entornos Javascript/java: Taller práctico de uso de los APIs o las librerías  de visualización. Orientado a desarrolladores en entornos javascript/java con conocimientos de programación en estos entornos.
  • Visualización en entornos flash: Taller práctico de uso de la librerías de visualización en estos entornos. Orientado a desarrolladores en entornos flash con conocimientos de actionscript.

Se van a utilizar los datos de Twitter del pasado mundial de baloncesto y se realizan distintos tipos de visualizaciones para comparar el grado de funcionalidad e interactividad de las distintas herramientas.

En la web de CAMON encontrarás toda la información sobre los módulos del taller de visualización. El acceso es libre y sólo tenéis que apuntaros aquí.


RTs vs. clicks

1 Comment »

Correlación entre el nº de clicks y los RTs entre los tweets que se han retransmitido cinco o más veces.

Para acceder a la visualización interactiva, pulsar en la imagen

Una de las preguntas que me hacía en el análisis del hashtag #manifiesto era si existía alguna correlación entre la retransmisión de una url y el número de clicks que recibía. He podido comprobarlo analizando los clicks de la urls acordadas por el servicio bit.ly usando el API de bit.ly

En los datos recogidos hay valores muy extremos, siendo 0,007 el índice de correlación lineal de la muestra total. Aparecen urls con miles de clicks que no se han retransmitido, mientras que otras muy retransmitidas no han llegado a cien clicks. Sin embargo, si se calcula la  correlación segregando la muestra en función del número de RTs el índice aumenta hasta el 0,41 para las urls que han tenido 5 o más RTs (caso que ilustra la cabecera del post). La siguiente imagen muestra el índice de correlación entre los clicks y los RTs en función de la muestra segregada por nº de RTs.

No se puede concluir  nada concreto de estos datos y es preciso medir otros valores como el número de seguidores para intentar aproximarse  a una medida de la influencia del emisor del tweet. Para calcularla aún debo esperar un poco.

Antecedentes

Cuando analicé las urls del los tweets del hashtag #manifiesto, descubrí  que las urls acortadas son una barrera para estudiar los enlaces que aparecen en los tweets. De una muestra de 20.236 tweets que contenían links,  el 82% estaban acortados. El coste en tiempo que supone expandir la url y la tasa de error dificultan obtener el enlace real. Para alargar una url se precisa un acceso http por lo que se dispara el tiempo de tratamiento, pasando a hablar de unidades de segundo por enlace.

Comentando con mi grupo de investigación esta limitación estuvimos buscando alternativas para solventar el problema, como paralelizar los accesos http o intentar interactuar con los servicios acortadores. Siendo bit.ly con un 55,76%. el servicio más extendido parecía el candidato ideal para estudiar qué posibilidades ofrecía. @nordez, rápidamente vio el API de bit.ly y me pasó el enlace.

Aunque mi intención era intentar mejorar el tiempo de expansión de los enlaces utilizando el API por su posibilidad de enviar peticiones de un grupo de urls, me llamó la atención una opción que permite obtener el número de clicks de un link dado y me distrajo del objetivo. La información que proporciona el API de los clicks está muy simplificada, tan solo se obtienen los clicks por usuario y los globales, mucho menos de los que suministra la interfaz web cuando a la url corta de bit.ly se le añade un + al final, pero supongo que se estarán reservando para opciones premium.

Metodología

He probado el API de bit.ly con la librería Python-bitly de  yoav.aviram para analizar los clicks de las urls acortadas con bit.ly. Procesar 4.331 urls ha llevado 78m 50.546s. aproximadamente 1,09 segundos por url y se han producido 37 errores (0,85%).  De los datos obtenidos se han eliminado las urls que se han comprimido anónimamente porque no aparece su número de clicks, quedando en 3.636 urls. Todos lo datos obtenidos están disponibles en este dataset.

Enlaces relacionados:

Related Posts Plugin for WordPress, Blogger...