Correlación entre el nº de clicks y los RTs entre los tweets que se han retransmitido cinco o más veces.
Para acceder a la visualización interactiva, pulsar en la imagen
Una de las preguntas que me hacía en el análisis del hashtag #manifiesto era si existía alguna correlación entre la retransmisión de una url y el número de clicks que recibía. He podido comprobarlo analizando los clicks de la urls acordadas por el servicio bit.ly usando el API de bit.ly
En los datos recogidos hay valores muy extremos, siendo 0,007 el índice de correlación lineal de la muestra total. Aparecen urls con miles de clicks que no se han retransmitido, mientras que otras muy retransmitidas no han llegado a cien clicks. Sin embargo, si se calcula la correlación segregando la muestra en función del número de RTs el índice aumenta hasta el 0,41 para las urls que han tenido 5 o más RTs (caso que ilustra la cabecera del post). La siguiente imagen muestra el índice de correlación entre los clicks y los RTs en función de la muestra segregada por nº de RTs.
No se puede concluir nada concreto de estos datos y es preciso medir otros valores como el número de seguidores para intentar aproximarse a una medida de la influencia del emisor del tweet. Para calcularla aún debo esperar un poco.
Antecedentes
Cuando analicé lasurls del los tweets del hashtag #manifiesto, descubrí que las urls acortadas son una barrera para estudiar los enlaces que aparecen en los tweets. De una muestra de 20.236 tweets que contenían links, el 82% estaban acortados. El coste en tiempo que supone expandir la url y la tasa de error dificultan obtener el enlace real. Para alargar una url se precisa un acceso http por lo que se dispara el tiempo de tratamiento, pasando a hablar de unidades de segundopor enlace.
Comentando con mi grupo de investigación esta limitación estuvimos buscando alternativas para solventar el problema, como paralelizar los accesos http o intentar interactuar con los servicios acortadores. Siendo bit.ly con un 55,76%. el servicio más extendido parecía el candidato ideal para estudiar qué posibilidades ofrecía. @nordez, rápidamente vio el API de bit.ly y me pasó el enlace.
Aunque mi intención era intentar mejorar el tiempo de expansión de los enlaces utilizando el API por su posibilidad de enviar peticiones de un grupo de urls, me llamó la atención una opción que permite obtener el número de clicks de un link dado y me distrajo del objetivo. La información que proporciona el API de los clicks está muy simplificada, tan solo se obtienen los clicks por usuario y los globales, mucho menos de los que suministra la interfaz web cuando a la url corta de bit.ly se le añade un + al final, pero supongo que se estarán reservando para opciones premium.
Metodología
He probado el API de bit.ly con la librería Python-bitly de yoav.aviram para analizar los clicks de las urls acortadas con bit.ly. Procesar 4.331 urls ha llevado 78m 50.546s. aproximadamente 1,09 segundos por url y se han producido 37 errores (0,85%). De los datos obtenidos se han eliminado las urls que se han comprimido anónimamente porque no aparece su número de clicks, quedando en 3.636 urls. Todos lo datos obtenidos están disponibles en este dataset.
El 10 de noviembre Twitter me activó la nueva función Re-Tweet (RT) que está probando con algunos usuarios. Tengo por costumbre hacer RT de los tweets que considero interesantes así que no tardé mucho en probarlo.
La verdad es que me defraudó la implementación de RT ya que no sigue el mismo criterio con el que se esta usando actualmente y se desvirtúa su función
El RT embebido en el texto del tweet tiene las siguientes características:
Es abierto: aparece en la cadena de RTs todos los que han participado tengan o no conexión entre ellos.
Es trazable: se puede ver quienes forman parte de la cadena de propagación.
Es sociable: es una vía para conocer a nuevos Twitteres a los que aún no seguimos o que los que han participado en la cadena del RT te conozcan.
No es filtrable: al ser un tweet normal no se filtra en en las listas.
El RT que está actualmente en versión beta:
No es abierto: solo se distribuye a los followers y se presenta como un tweet que tú aconsejas leer.
No es trazable: no aparece en la cadena de RTs todos los que han participado, sólo el autor original del tweet.
No es sociable: se reduce el número de twetteres que podemos conocer por los RTs.
Es filtrable: al ser un tweet especial se filtra de las listas como se hace con los @replay.
Tengo que definir qué es Twitter para que un alumno realice un PFC (Proyecto Fin de Carrera) y me doy cuenta lo difícil que es explicar algo que se aprende mediante el uso. Vaya este intento que espero que sea útil a quién esté interesado en saber qué es eso de Twitter.
¿Qué es Twitter?
Es una aplicación encuadrada en el concepto de microblogging cuya unidad de publicación se denomina tweet (trino, gorjeo) y consiste en un texto de un máximo de 140 caracteres. La limitación del tamaño del mensaje viene dada por la longitud de los SMS (mensajes de texto) de los teléfonos móviles. En un principio se pensó que éste sería el canal de difusión de los tweets pero en la práctica se utilizan los teléfonos con GPRS o 3G para acceder a Twitter. Esta plataforma ha nacido con el despegue del uso de los datos en movilidad y es una de las aplicaciones que, junto al correo y las plataformas de redes sociales, está favoreciendo más al crecimiento de teléfonos con acceso a Internet.
¿Cómo son las relaciones en Twitter?
Lo normal en las plataformas de redes sociales es que para que dos usuarios puedan compartir información tiene que haber un consentimiento mutuo entre ellos. Sin embargo, en Twitter se ha roto esta regla. Las relaciones que se pueden establecer entre los usuarios de Twitter son asimétricas, tal vez sea esta la causa de su éxito, como dijo el pasado día 15 de septiembre de 2009 Albert-László Barabási en una conferencia en Fundación Telefónica. En Twitter, cada usuario tiene un conjunto de usuarios favoritos, denominados Following, a los que puede ver sus tweets y a su vez posee un conjunto de usuarios de los que es favorito, llamados Followers, que pueden leer lo que él escribe. Cuando dos usuarios de Twitter se corresponden, es decir, ambos siguen los tweets del otro se les denomina Friends, aunque en la plataforma solo se muestran los Following y los Followers, se pueden deducir los Friends de ambos conjuntos.
¿Qué perfiles de usuarios hay en Twitter?
Dependiendo de la proporción entre Following/Followers se pueden agrupar en tres perfiles:
Es una respuesta al mensaje de otro usuario y comienza por el carácter @ seguido del nombre del usuario (@usuario) y a continuación el texto del mensaje. Ejemplo
Es un mensaje privado entre dos usuarios. Ambos tienen que ser Friends. Se envía escribiendo el carácter d seguido de un espacio, el nombre del usuario (d usuario) y a continuación el texto. Estos mensajes se reciben como si fueran correos y se almacenan en la carpeta correspondiente de enviados/recibidos.
¿Hay propiedades emergentes en la red social de Twitter?
Sí, los usuarios de Twitter han “estandarizado” de forma espontánea alguna funcionalidad en el contenido del mensaje, como es el caso de:
RT
Retransmisión de Tweet. Se utiliza para difundir mensajes interesantes vistos en Twitter de forma que se propaguen por las distintas subredes de Twitter. Comienza por el carácter RT seguido por @usuario y el texto del mensaje. Ejemplo:
Son palabras claves para poder etiquetar los tweets. Comienzan por el carácter # que va seguido de la etiqueta (#etiqueta). Se utilizan para poder agrupar información relacionada y sobre todo en los eventos en los que se utiliza Twitter. Ejemplo:
El contenido de los Tweets invita a contestar a la pregunta “¿Qué estás haciendo?” pero los usuarios de Twitter también responden a otras cuestiones o le dan otros usos:
Comunicación personal: Era su uso inicial. Mensaje solo de texto diciendo lo que se está haciendo, leyendo, música que se está escuchando, etc.
Comunicación de grupos de interés: Nace junto con el hash tag, y se utiliza para comunicación en torno a un tema concreto. Muy usado en eventos que interactúan con Twitter o para investigar o para conocer gente con intereses similares.
Difusión de información: Mensajes de recomendación de lectura de un post o artículos mediante una URL. Es un mecanismo muy utilizado para difundir los posts del blog del propio usuario. No se considera autobombo. Existen aplicaciones que traducen URLs largas en otras más cortas (ejemplo: tinyurl.com) para poder aprovechar mejor los 140 caracteres del mensaje.
Información gráfica: Compartir fotos. Twitter no permite subir imágenes pero es posible publicarlas por medio de otras aplicaciones como son Twitpic.com o yfrog.com
¿Cómo es la interfaz de usuario de Twitter?
Twitter ofrece un API público que ha dado lugar a un amplio número de aplicaciones de escritorio y de dispositivos móviles que permiten acceder a Twitter como una alternativa a su web Twitter.com. Básicamente se accede a la misma información que es la siguiente:
Los tweets de sus following ordenados cronológicamente de más recientes a más antiguos. Esto implica que cada usuario tiene una visión personalizada de Twitter
Los mensajes de respuesta a su usuario
Los mensajes directos
Los hash tag más populares en Twitter
También es posible vigilar lo que se habla sobre un tema concreto desde la página http://search.twitter.com. Por ejemplo:#simonetwork, el hash tag para interactuar con las mesas redondas de evento Simo Network que se ha celebrado la semana pasada.
¿Merece la pena investigar sobre el contenido de Twitter?
Una vez que he definido los elementos de los que consta Twitter he pasado a analizar la información que se podría obtener y me he sorprendido de que de algo tan simple sea posible cruzar tanta información de interacción social. Promete ser muy interesante este PFC.
Twitografía:
Algunos tweets de los ejemplos han sido extraídos de esta mágnifica recopilación de Alfónso Alcántara, aka @yoriento, fructifero bloguero y Twitero compulso.
Recursos de microblogging recopilados por los aprendices
Aquí tienen un ingenioso vídeo que explica twitter en 30 segundos. Este vídeo forma parte de un proyecto colaborativo del grupo VideoWeb (organizado por Hombrelobo), donde unas 10 personas se han apuntado para hacer un vídeo sobre Twitter que se integrará en un único vídeo.