Archive for the ‘Experimentos’ Category

La oreja mecánica 20N

No Comments »

Actualizado 22-11-2011: añadido lo más destacado del día después de la campaña (al final para conservar la cronología)

Antes que se cierren las urnas, aquí pongo unas conversaciones que ha detectado mi oreja mecánica escuchando los tweets emitidos por @conRubalcaba, @marianorajoy, @cayo_lara, @psoe,@ppopular, @iunida, @upyd, @Proyectoequo, @democraciareal, @acampadasol y su propagación por otros usuarios.

Para ver el fichero HTML con los textos, pulsar en las imágenes.

Último día de campaña

Jornada de reflexión

Votando que es gerundio hasta las 18:30

Valoración de los resultados (21 y 22 de noviembre)


Unas pinceladas sobre el debate Rubalcaba-Rajoy

No Comments »

No tenía intención de monitorizar el debate Rubalcaba-Rajoy pero al ver la ebullición de mi TL sobre este tema y la “guerra” de hashtag pensé que podría obtener un interesante dataset para analizar la propagación de lemas. No me equivoqué e incluso ha superado mis expectativas.

Por primera vez un acontecimiento político acapara la atención en Twitter tanto como un Madrid-Barsa. A los expertos dejo este análisis y me ciño a poner a grandes rasgos como fue este debate en cuanto audiencias, guerra de hashtags, menciones a candidatos y mensajes más difundidos. No puedo entrar en más profundidad porque llevaría un tiempo importante y en este caso prima más la rapidez en obtener unas pinceladas que un estudio exhaustivo.  Cada cosa a su tiempo y a su medio de publicación.

Audiencias

Entre las 10 y las 11 (9-10 hora GMT) se alcanzaron velocidades de publicación de 50 TPS. Durante este periodo la media de publicación  fue de 2,5 Tweets/usuario. La incorporación al debate fue muy temprana, casi dos tercios de los usuarios se incorporaron al debate desde su inicio.

(pulsando en la imagen se accede a la imagen interactiva)

“Guerra” de hashtags

Se motorizaron los hashtags #ReiniciaElDebate , #seacaboelcirco, #ocupaeldebate, #undebatedecisivo, #debate2011, #debate, #caraacara. Como se puede apreciar en la siguiente imagen que recoge la evolución de los diez hashtags más mencionados, la magnitud de las menciones es bastante inferior al volumen total de tweets por lo que se deduce que hubo mucha dispersión de hashtags y muchos mensajes sin ellos.

Al comienzo del debate eran TT #ReiniciaElDebate y #seacaboelcirco. Sin embargo estos hashtahs no han sido los más mencionados. Al final el hashtag #eldebate fue TT,  que aunque no fue monitorizado se recogió por estar con otros hashtags supervisados. Los hashtags propuestos por los partidos #caraacara y #undebatedecisivo no fueron TT, pero #caraacara tuvo más menciones que los contra-hashtags #ReiniciaElDebate y #seacaboelcirco.

(pulsando en la imagen se accede a la imagen interactiva)

Menciones a Candidatos

La diferencia de las menciones fue mayor durante la hora punta 10-11 (9-10 hora GMT) en la que dos tercios de los tweets contenían menciones a Rajoy mientras que el 40% mencionaban a Rubalcaba.

(pulsando en la imagen se accede a la imagen interactiva)

Conversaciones

Las frases más mencionadas como siempre son las que van cargadas de ironía. El tamaño de la letra es función del número de repeticiones y el valor que aparece junto al caracter # es el número de veces que ha aparecido.

(No he podido integrar el html en el post, para ver el fichero original pulsar en la imagen)


(Revisado) No por mucho tuitear amanece más temprano

4 Comments »
  • Versión revisada del post No por mucho tuitear anamece más temprano.  Lamentablemente cometí un error en el ajuste de la hora GMT a la hora de España. En vez de sumar 2 en las regiones de la Península y Baleares y 1 en Las Islas  Canarias, lo resté, de forma que los datos están adelantados 4 horas. Además, por un fallo del algoritmo los datos correspondían a la última semana de julio y no a la media de los datos del mes . Esto cambia mucho el análisis y he preferido sacar una nueva versión del experimento y marcar lo que no era correcto en la versión anterior

    Cada vez más Twitter forma parte de la rutina de las personas, desde el ordenador, la tableta o el smartphone los usuarios siguen su TL y publican sus tweets. Gracias a la movilidad el lugar no es un handicap, tan solo el descanso o las tareas prioritarias son un freno para su uso. Por este motivo, analizando la actividad de sus usuarios se pueden deducir sus costumbres, permitiendo responder a preguntas como estas:

    • ¿Qué patrón de publicación siguen las distintas regiones de España?
    • ¿Se publica más por la mañana o por la tarde o por las noches?
    • ¿Qué regiones madrugan o trasnochan más?
    • ¿Hay diferencia entre el Norte y el Sur o entre la Península y las Islas?
    • ¿Cuál es el perfil de las regiones con grandes ciudades?
    • ¿Qué patrones siguen cada uno de los días de la semana?

    Todas estas preguntas tienen su respuesta en las siguientes gráficas que muestran porcentaje de tweets publicados en cada hora durante el mes de julio en distintas regiones de España:.

    • La primera de ellas muestra de forma diferenciada los patrones de publicación de la semana laboral y del fin de semana de cada una de las regiones de España. En esta imagen estática aparece destacado Madrid pero pulsando en ella se puede acceder a la gráfica interactiva y seleccionar otras regiones o una combinación de ellas para comparar los distintos patrones.

    • La segunda imagen recoge el patrón de cada uno de los días de la semana para cada una de las regiones de España. Lunes, martes, miércoles y jueves aparecen con color gris, el viernes con color verde, el sábado en color azul y el domingo en color rojo.  Como se puede apreciar los viernes se separan un poco del patrón de los días laborables y los días festivos tienen su perfil particular. Pulsando en la siguiente imagen se puede acceder a una gráfica interactiva en la que se puede seleccionar cada uno de los días de la semana o una combinación de ellos.

    Conclusiones

    • Patrón de tráfico:
      • En los dominios de Twitter nunca se pone el sol. Siempre hay usuarios tuiteando a todas horas, no existe la noche para Twitter.
      • El patrón de tráfico de Twitter es diferente al del teléfono: Los picos de tráfico de Twitter son a las 13:00 y a las 23:00 y las zonas valle son a las 19:00 (en días laborables) y en la madrugada. Este comportamiento es diferente al del teléfono en el que las horas cargadas son las 10:00-12:00 en la mañana  y las 20:00 en la tarde y la zonas  valle son las horas de la comida y la noche. Twitter, por tanto, es algo más que un canal de comunicación para hablar con los demás y se extiende a unas horas en las que la gente no se comunica habitualmente.
      • Festivos vs. laborables: En los días laborables se aprecia la transición del trabajo al ocio. La frecuencia de publicación va cayendo desde las 13:00 a  las 19:00 para subir gradualmente hasta las 23:00 mientras que en los días festivos el porcentaje de tweets desde la mañana a la noche crece gradualmente. Por otra parte en los días festivos se aprecia que los usuarios se incorporan al TL entre una y dos horas más tarde que en los días laborables y el porcentaje de tweets nocturnos es inferior.  El viernes es un día de transición de lo laboral a lo festivo, hasta la tarde se comporta como día laboral aunque la incorporación al TL es más temprana y más marcada por la mañana y por la noche se ajusta a un patrón de festivo, incluso más acentuado, con un porcentaje de  tweets nocturnos inferior a los del sábado y a los del domingo. Parece que se tuitea más en horas de ocio, pero cuando “se sale a la calle” baja la intensidad de publicación.
      • Mañanas vs. Noches: En la mayoría de las regiones, salvo en Madrid, Cataluña y Baleares, se tuieta más por las noches que por las mañanas durante la semana laboral. En el fin de semana se iguala la frecuencia de publicación entre la mañana y la noche en todas las regiones.
    • Comparación entre regiones:
      • Madrugadores vs. Trasnochadores la más madrugadora es Cataluña pero le siguen de cerca Madrid, País Vasco y Canarias. Los más trasnochadores son Aragón, Baleares y el Noroeste con un porcentaje superior al 2% de tweets entre las 3:00 am. a las 5:00 amEl Sur y Canarias son las regiones con el porcentaje más bajo esa franja horaria.
      • Norte vs. Sur: En el norte la transición del trabajo al ocio en la semana laboral es la más pronunciada que en el resto de regiones.  No existen diferencias notables entre el norte y el sur, Incluso el patrón de publicación del País Vasco se parece más al del Sur que al del Noroeste.
      • Islas vs. Península: las islas no pueden ser más diferentes, Canarias es madrugadora y Mallorca es trasnochadora. Canarias se parece al Sur y Mallorca no tiene parecido con ninguna otra región.
      • Grandes ciudades: El volumen de tweets generados desde las grandes ciudades hace que las regiones a las que pertenecen queden condicionadas al patrón de las grandes urbes. Tanto Madrid como Cataluña muestran unos perfiles similares de publicación, ambas son madrugadoras y tienen menos actividad por la noche que por la mañana al contrario que resto de regiones.

    Metodología:

    • Datos recogidos de Twitter del 1 al 31 de Julio de 2011, 32.878.321 tweets de 1.660.275 usuarios únicos, con la siguiente distribución por regiones:
      • Aragón: 1.003.958 tweets de 46.219 usuarios únicos
      • Cataluña: 5.497.516 tweets de 284.585 usuarios únicos
      • Canarias: 871.765 tweets de 37.105 usuarios únicos
      • Levante: 3.016.412 tweets de 139.134 usuarios únicos
      • Madrid: 9.045.342 tweets de 586.313 usuarios únicos
      • Mallorca: 678.043 tweets de 41.318 usuarios únicos
      • Noroeste: 5.137.426 tweets de 234.447 usuarios únicos
      • País Vasco: 1.138.830 tweets de 59.578 usuarios únicos
      • Sur: 6.489.029 tweets de 231.576 usuarios únicos
    • Herramientas:
      • herramienta de minería de datos propia
      • Visualización con Tableau Public

  • No por mucho tuitear amanece más temprano

    8 Comments »

    Actualizado 10-09-2011:


    Perdonar la confusión que puedo generar pero lamentablemente cometí un error en el ajuste de la hora GMT a la hora de España. En vez de sumar 2 en las regiones de la Península y Baleares y 1 en Las Islas  Canarias, lo resté, de forma que los datos están adelantados 4 horas. Además, por un fallo del algoritmo los datos correspondían a la última semana de julio y no a la media de los datos del mes .

    Esto cambia mucho el análisis,  encontrarán tachado en este post lo que no es cierto y pueden acceder  aquí a la versión revisada.

    Cada vez más Twitter forma parte de la rutina de las personas, desde el ordenador, la tableta o el smartphone los usuarios siguen su TL y publican sus tweets. Gracias a la movilidad el lugar no es un handicap, tan solo el descanso o las tareas prioritarias son un freno para su uso. Por este motivo, analizando la actividad de sus usuarios se pueden deducir sus costumbres, permitiendo responder a preguntas como estas:

    • ¿Qué patrón de publicación siguen las distintas regiones de España?
    • ¿Se publica más por la mañana o por la tarde?
    • ¿Qué regiones madrugan o trasnochan más?
    • ¿Hay diferencia entre el Norte y el Sur o entre la Península y las Islas?
    • ¿Cuál es el perfil de las regiones con grandes ciudades?

    Todas estas preguntas tienen su respuesta en la siguiente gráfica que muestra el porcentaje de tweets publicados en cada hora durante el mes de julio en distintas regiones de España. En esta imagen estática aparece destacado Madrid pero pulsando en ella se puede acceder a la gráfica interactiva y seleccionar otras regiones o una combinación de ellas. En la gráfica aparecen de forma diferenciada los patrones de publicación de la semana laboral y del fin de semana

    Esta imagen esta adenlantada 4 horas

    Conclusiones:

    • En los dominios de Twitter nunca se pone el sol. Siempre hay usuarios tuiteando a todas horas, no existe la noche para twitter.
    • El mismo patrón de tráfico que el del Teléfono. Al ver la curva de tráfico de los tweets me vinieron a la memoria los tiempos en que trabajaba en conmuntación de circuitos porque se parece mucho al tráfico de llamadas telefónicas. Twitter no es más que otro canal para comunicarnos con los demás. Aunque tanto en la semana laboral como en el fin de semana los picos de publicación son a las 9:00 y a las 19:00, las curvas son algo diferentes. Durante la semana laboral toma forma de camello con dos jorobas pero en el fin de semana aparece una tercera joroba a las 11:00. Esta protuberancia puede deberse a los dormilones que se incorporan al TL y si esta hipótesis fuera cierta, los madrileños son a los que se le pegan más las sábanas.
    • Mañanas vs. Tardes: Madrid marca una diferencia en la semana laboral porque tuitea más por las mañanas que por las tardes, pero en fin de semana sigue el mismo patrón que el resto de regiones. ¿será que en los días laborables de 18:00 a 20:00 están todos los madrileños en el atasco de tráfico? En la hora de la comida el País Vasco y el Noroeste son los que tienen más baja la frecuencia de publicación, cosa totalmente lógica dado que la tarea de comer no es nada trivial en el norte y requiere de toda su concentración. Por las tardes el Noroeste y Canarias son los que tienen una mayor actividad tuitera.
    • Madrugadores vs. Trasnochadores la más madrugadora es Cataluña pero le siguen de cerca Madrid, País Vasco y Canarias. Los más trasnochadores son Aragón y Baleares.
    • Norte vs. Sur: En cultura digital está todo por escribir. Se parece más el patrón de publicación del País Vasco al del Sur que al resto de las regiones del Norte.
    • Islas vs. Península: las islas no pueden ser más diferentes, Canarias es madrugadora y Mallorca es trasnochadora. Canarias se parece al Sur y Mallorca no tiene parecido con ninguna otra región.
    • Grandes ciudades: El volumen de tweets generado desde las grandes ciudades hace que las regiones a las que pertenecen queden condicionadas al patrón de las grandes urbes. Tanto Madrid como Cataluña muestran unos perfiles similares de publicación, ambas son madrugadoras y tienen menos actividad por la tarde que el resto de regiones..

    Metodología:

    • Datos recogidos de Twitter del 1 al 31 de Julio de 2011, 32.878.321 tweets de 1.660.275 usuarios únicos, con la siguiente distribución por regiones:
      • Aragón: 1.003.958 tweets de 46.219 usuarios únicos
      • Cataluña: 5.497.516 tweets de 284.585 usuarios únicos
      • Canarias: 871.765 tweets de 37.105 usuarios únicos
      • Levante: 3.016.412 tweets de 139.134 usuarios únicos
      • Madrid: 9.045.342 tweets de 586.313 usuarios únicos
      • Mallorca: 678.043 tweets de 41.318 usuarios únicos
      • Noroeste: 5.137.426 tweets de 234.447 usuarios únicos
      • País Vasco: 1.138.830 tweets de 59.578 usuarios únicos
      • Sur: 6.489.029 tweets de 231.576 usuarios únicos
    • Herramientas:
      • herramienta de minería de datos propia
      • Visualización con Tableau Public

    Agudeza visual: encuentra las diferencias

    1 Comment »

    Busca las diferencias en estos treemaps, ha transcurrido entre ellos UN AÑO de la era Twitter.

    Mención de enlaces en la campaña #manifiesto

    Mención de enlaces en el 15-M

    Related Posts Plugin for WordPress, Blogger...