Posts Tagged ‘menciones’

FICOD visto desde twitter

8 Comments »

La relevancia de Twitter es cada vez mayor en los eventos, tanto para los organizadores como para los asistentes. Para los organizadores es una canal de comunicación directo con los asistentes y a éstos les permite sentirse integrados dentro del evento y conocer todo lo que ocurre dentro de él en tiempo real.

Los asistentes no son solo los presenciales, también hay que incluir a los presentuales (término creado por Fernando Sáez Vacas) que siguen las conferencias por streaming y se comunican vía Twitter con el resto de asistentes. Mientras transcurre el evento se intensifican los tweets entre usuarios que ya se conocían, se establecen nuevas conexiones y sobre todo se opina y se difunden las opiniones de otros.

Todo evento tiene asociado su hashtag oficial para aglutinar la conversación que fluye entre los asistentes y hacerla visible a todos los interesados. Gracias a los hashtags oficiales es posible recolectar con bastante precisión los tweets del evento.

Me pareció muy interesante analizar la conversación intensa de estos eventos y realizar una comparación entre ellos. Empecé por el FICOD y en este post muestro los primeros resultados correspondientes a la red que se forma con las menciones de unos usuarios a otros.

Red de menciones, color por relevancia

Tamaño de los nodos según el número de menciones obtenidas y realizadas (Degree)

Código de colores:

  • Rojo= Usuarios que pertenecen al grupo de  los 50 más mencionados y los 50 más activos twiteando,
  • Verde= Usuarios que están entre los 50 más mencionados,
  • Azul oscuro= Los 50 usuarios que más han twiteado
  • Azul twitter= Resto de los usuarios

Zoom del centro de la red, color por relevancia

Red de menciones, color por seguidores


Tamaño de los nodos según el número de menciones obtenidas y realizadas (Degree)

Código de color según número de seguidores:

  • Gris claro=entre 0 y 9 .
  • Amarillo= entre 10 y 99
  • Verde= entre 100 y 999
  • Azul= entre 1000 y 9.999
  • Morado= entre 10.000 y 99.999
  • Rojo= entre 100.000 y 1.000.000

Zoom del centro de la red, color por seguidores

Red de los 50 usuarios más activos y los 50 más mencionados

Se ha seleccionado los usuarios más destacados entre los 50 más mencionados y los 50 más activos twiteando, algunos de ellos pertenecen a ambos grupos. Las relaciones de los grafos que se muestran a continuación son las menciones entre estos usuarios. Por tanto, muestran el grado de relación de los nodos más relevantes. El código de color utilizado es:

  • Rojo= entre los más mencionados y los más activos,
  • Verde= Entre los más mencionados,
  • Azul oscuro= Los más activos twiteando

El tamaño de los grafos difiere según la medida de la relevancia

  • Tamaño de los nodos según menciones recibidas (In-degree)

  • Tamaño de los nodos según número de menciones realizadas (Out_degree)

  • Tamaño de los nodos según el número de menciones recibidas y realizadas (Degree)

Datos de interés

  • Se recogieron 25.135 tweets de 5.503 usuarios distintos que dieron lugar a 15.738 menciones de 5.238 usuarios.
  • Los tweets fueron recogidos con una aplicación propia usando el Streaming API de Twitter desde 13 de noviembre de 2010 a las 09:48:04 hasta el 18 de noviembre de a las 23:58:19 monitorizando los hashtags #FICOD, #FICOD10, #FICOD2010
  • El grafo se ha generado con una herramienta propia
  • Las visualizaciones se han realizado con la aplicación Gephi

RTs vs. clicks

1 Comment »

Correlación entre el nº de clicks y los RTs entre los tweets que se han retransmitido cinco o más veces.

Para acceder a la visualización interactiva, pulsar en la imagen

Una de las preguntas que me hacía en el análisis del hashtag #manifiesto era si existía alguna correlación entre la retransmisión de una url y el número de clicks que recibía. He podido comprobarlo analizando los clicks de la urls acordadas por el servicio bit.ly usando el API de bit.ly

En los datos recogidos hay valores muy extremos, siendo 0,007 el índice de correlación lineal de la muestra total. Aparecen urls con miles de clicks que no se han retransmitido, mientras que otras muy retransmitidas no han llegado a cien clicks. Sin embargo, si se calcula la  correlación segregando la muestra en función del número de RTs el índice aumenta hasta el 0,41 para las urls que han tenido 5 o más RTs (caso que ilustra la cabecera del post). La siguiente imagen muestra el índice de correlación entre los clicks y los RTs en función de la muestra segregada por nº de RTs.

No se puede concluir  nada concreto de estos datos y es preciso medir otros valores como el número de seguidores para intentar aproximarse  a una medida de la influencia del emisor del tweet. Para calcularla aún debo esperar un poco.

Antecedentes

Cuando analicé las urls del los tweets del hashtag #manifiesto, descubrí  que las urls acortadas son una barrera para estudiar los enlaces que aparecen en los tweets. De una muestra de 20.236 tweets que contenían links,  el 82% estaban acortados. El coste en tiempo que supone expandir la url y la tasa de error dificultan obtener el enlace real. Para alargar una url se precisa un acceso http por lo que se dispara el tiempo de tratamiento, pasando a hablar de unidades de segundo por enlace.

Comentando con mi grupo de investigación esta limitación estuvimos buscando alternativas para solventar el problema, como paralelizar los accesos http o intentar interactuar con los servicios acortadores. Siendo bit.ly con un 55,76%. el servicio más extendido parecía el candidato ideal para estudiar qué posibilidades ofrecía. @nordez, rápidamente vio el API de bit.ly y me pasó el enlace.

Aunque mi intención era intentar mejorar el tiempo de expansión de los enlaces utilizando el API por su posibilidad de enviar peticiones de un grupo de urls, me llamó la atención una opción que permite obtener el número de clicks de un link dado y me distrajo del objetivo. La información que proporciona el API de los clicks está muy simplificada, tan solo se obtienen los clicks por usuario y los globales, mucho menos de los que suministra la interfaz web cuando a la url corta de bit.ly se le añade un + al final, pero supongo que se estarán reservando para opciones premium.

Metodología

He probado el API de bit.ly con la librería Python-bitly de  yoav.aviram para analizar los clicks de las urls acortadas con bit.ly. Procesar 4.331 urls ha llevado 78m 50.546s. aproximadamente 1,09 segundos por url y se han producido 37 errores (0,85%).  De los datos obtenidos se han eliminado las urls que se han comprimido anónimamente porque no aparece su número de clicks, quedando en 3.636 urls. Todos lo datos obtenidos están disponibles en este dataset.

Enlaces relacionados:

Related Posts Plugin for WordPress, Blogger...