Viralidad en Twitter: TweetMatrioska
Propagación espacio/temporal de una curiosa cadena de tweets encapsulados unos dentro de otros. Al experimento le he llamado TweetMatrioska porque al igual que las tradicionales muñecas rusas, un tweet encerraba un tweet que a su vez contenía otro tweet y así sucesivamente hasta llegar al tweet origen. (El mapa está realizado con CartoBD con el wizard de Torque. Una auténtica maravilla por lo potente y sencillo de usar) Todo empezó el día 14 de febrero cuando me enteré de esta cadena por @estebanmoro y @moebio. Buscando el origen encontré que el causante, @BenHowe, no sin antes examinar casi 40 tweets.
Este experimento despertó mi curiosidad ya que tiene mucha relación con mi investigación sobre propagación y me puse rápidamente a intentar recuperar los tweets de esta cadena. Encontré esta solución pero quise analizar esta dinámica de difusión con mis propios medios y estos son los primeros resultados del experimento Topología de red de propagación
- Número de nodos: 10.568
- Número de conexiones entre los nodos (las conexiones múltiples entre nodos se cuentan como una) : 11.170
- Diámetro de la red: 70 (la cadena mayor fue de 70 tweets anidados!!)
- Longitud media de las cadenas: 20,54
- Coeficiente de clustering: 0,006
Propagación Temporal El siguiente timeline representa el número de tweets/hora (hora GMT) durante el periodo de propagación.
Para obtener los datos he seguido la siguiente metodología:
- Buscar el origen del tweet desde mi cadena (con 38 eslabones)
- Partiendo del tweet origen obtener con search API los tweets que incluían la URL del tweet origen de una forma recursiva. Se encontraron 11.339 tweets de 10.568 usuarios distintos. No conseguí por este método todos los tweets (no encontré elementos de mi cadena). Esto ha podido deberse a dos motivos
- El search API no proporciona todos los mensajes consultados
- Si la URL del tweet se encapsula con un acortador tipo bitly o owly (se usa una app de escritorio) no se encuentra cuando se busca el tweet como https://twitter.com/screen_name/status/xxxxxxxxxxxx
- Generar el grafo de propagación con un script ad hoc para este tipo de propagación
- Buscar las coordenadas geográficas de las localizaciones declaradas en el perfil del usuario con el API de Google Maps (tiene un rate limit de 2.500 al día). Se obtuvieron las coordenadas del 70% de los usuarios