Jornada 25 Aniversario Asociacion de Internautas


Bots de Twitter (@BotsPoliticosNo)

#Campaña26J: ¿Qué candidato recibe más apoyo real en Twitter? #periodismodatos


El objetivo de este análisis es intentar averiguar, sin que haya lugar a dudas, cuál de los cuatro candidatos a la presidencia de Gobierno de España recibe más apoyo en la red social Twitter, así como el orden en que quedarían situados los tres restantes.




Se han tomado dos períodos de estudio en función de cuál haya sido el endpoint de la API de Twitter utilizado para la extracción de datos: el primero va del 1 de enero al 4 de junio de 2016 y el segundo del 4 de mayo al 4 de junio.

De forma intencionada se ha prescindido de las habituales estadisticas de followers ya que desde nuestro punto de vista no reflejan de manera idónea el apoyo suscitado por los candidatos. Tampoco se han utilizado en este caso las menciones hacia los candidatos ya que en ellas se mezclan opiniones de apoyo y de rechazo difíciles de catalogar. En su lugar se han analizado mediante varias técnicas los retweets (RTs) y los favoritos/likes (FAVs) recibidos por las cuentas Twitter de los candidatos,

Al mismo tiempo se ha intentado estimar el peso del tuiteo masivo del ciberactivismo de cada partido sobre los retweets que reciben los candidatos con objeto de saber en qué medida es real el apoyo que reciben en esta red social.

1. ANÁLISIS DE RETWEETS

Los RETWEETS (RTs) se producen cuando alguien reenvia tweets emitidos por otros usuarios. Las personas más influyentes obtienen más RTs. Por ello el número de RTs  que reciben los candidatos a las elecciones 26J puede servir como referencia del grado de aceptación que tienen en redes sociales.

Retweets recibidos por cada candidato

En el siguiente gráfico se ha representado la cantidad de retweets semanales recibidos por los cuatro candidatos desde el 1 de enero hasta el 4 de junio de 2016.

Durante el período analizado la cuenta que recibió más retweets fue la de @pablo_iglesias_ (PODEMOS) seguido de @albert_rivera (CIUDADANOS), @sanchezcastejon (PSOE) y @marianorajoy (PP)

Al representar la cantidad diaria de retweets recibidos durante el mismo período, se obtiene un gráfico algo más enrevesado pero que permite ver cuales han sido las fechas más significativas desde el punto de vista de la repercusión de los tweets de los candidatos.

Los dos tweets más retuiteados corresponden a @pablo_iglesias_ y @albert_rivera. El primero, un tweet en clave de humor que incluía vídeo, alcanzó los 24.684 RTs; y el segundo, tratando sobre ETA (Otegui) y Venezuela (Leopoldo López), los 17.487 RTs.

En el ranking de los 10 más retuiteados encontramos 8 tweets de @pablo_iglesias_ y 2 de @albert_rivera. Este resultado puede ser interpretado como un indicio de la superioridad de los "nuevos partidos" en las redes sociales frente a los partidos tradicionales.

De hecho, el primer tweet de @marianorajoy figura en la posición 13 y el más retuiteado de @sanchezcastejon no aparece hasta la posición 65.

Rendimiento de los tweets

Podría darse el caso de que alguno de los candidatos sea un gran emisor de tweets, y por ello obtenga al final más cantidad de RTs que el resto de los candidatos por el mero hecho de ser más activo en la red social. Para informar sobre esa posibilidad es útil el parámetro que representa el número de retweets obtenidos por cada tweet enviado como forma de calcular el rendimiento medio obtenido por cada tweet. La evolución comparada de este ratio se puede ver en el siguiente gráfico en el que por períodos semanales se ha dividido el número de RTs obtenidos por cada candidato entre el número de tweets que había emitido.

No se aprencian variaciones respecto a los resultados obtenidos por retweets totales. La mayor parte de las semanas el candidato que obtuvo más retweets por cada tweet enviado fue Pablo Iglesias, aunque en tres ocasiones Albert Rivera consiguió ponerse por delante en el rendimiento obtenido de los tweets, la última de ellas durante su reciente viaje a Venezuela. Son precisamente los dos candidatos que reciben menos RTs quienes obtienen un rendimeinto más bajo por sus tweets.

¿Influyen los retweets masivos en estos resultados?

Acabamos de ver la cantidad de retweets que han recibido los cuatro candidatos durante lo que va de año 2016. Teniendo en cuenta dicho parámetro Pablo Iglesias se perfila como el candidato con más tirón en Twiiter, seguido por Albert Rivera, Pedro Sánchez y Mariano Rajoy. Pero, ¿que hay de la calidad de los retweets? A continuación trataremos de comprobar si los retweets recibidos por los candidatos representan realmente el apoyo de los usuarios de Twitter, estimando en qué medida están influidos por el ciberactivismo de partido.

Composición de los retweets

En general la cantidad de RTs hacia una cuenta expresa de una manera bastante fiable el interés de los usuarios de Twitter por los contenidos que esta genera, y también el grado de simpatía o admiración que despierta. Sin embargo en ocasiones la cantidad de RTs es aumentada artificialmente mediante retweets masivos. En el ámbito político esto ocurre principalmente de dos maneras:

  • retweets procedentes de ciberactivistas políticos organizados desde cada partido. Son personas comprometidas con un proyecto político, que emiten desde sus propias cuentas o bien desde cuentas de partido asociadas a diferentes localidades. Pensamos que es una manera lícita de promoción siempre que los RTs se hagan desde las propias cuentas de los ciberactivistas o desde cuentas reales de partido. De esta manera cualquier lector del tweet podrá conocer la implicación de la cuenta emisora con la ideología que transmite.
  • retweets emitidos por cuentas de perfil falso (también llamadas bots), cuyos contenidos ideologizados son proporcionados por un administrador, bien de manera manual, bien de manera automatizada mediante determinadas herramientas. Estas emisiones son consideradas spam político y pretenden promocionar una determinada ideología, partido político o persona. El engaño está en que pretenden ser opiniones espontáneas de personas desvinculadas con la política. Tendemos a dar menos credibilidad a las informaciones que llegan desde cuentas de un partido o personas identificadas con el mismo. Por eso en algunas ocasiones se intenta modificar el voto de los usuarios de Twitter mediante redes de perfiles falsos. En Twitter Bots hemos dedicado el último año y medio a denunciarlas.

Detección de retweets masivos

Una parte de los retweets recibidos por los cuatro candidatos fue realizada desde cuentas de tuiteo masivo, generalmente procedente de cuentas de partido y ciberactivistas. Para estimar el peso que tienen los retweets masivos hemos calculado, para cada candidato, una curva que representa el número de RTs recibidos en el período de estudio en función de la cantidad total de RTs sobre el candidato que emitieron sus retuiteadores. Para entenderlo utilizaremos la curva de los RTs obtenidos por los tweets del candidato Pedro Sánchez.

El período analizado ha sido los 30 días que van desde el 4 de Mayo hasta el 4 de junio de 2016. En la parte de abajo (eje x) se pueden ver cantidades que van desde 0 hasta 400. Ahí se van a representar los RT totales (sobre el candidato) que ha enviado cada una de las cuentas que retuitearon a @sanchezcastejon. En el eje vertical (eje y) se muestran unas cantidades entre 0 y 70.000 que se corresponden con el número de retweets recibidos por @sanchezcastejon en dicho período. Como ejemplo, el punto negro situado en la curva, cuyas coordentadas son 150 (eje x) y 20.000 (eje y), significa que el número total de RTs emitido por las cuentas que han hecho 150 o más retweets hacia @sanchezcastejon durante el período de estudio es de 20.000. Cuanto más pegada hacia los dos ejes esté la curva, menos afectado por retweets masivos está el candidato.

Se han representado en un mismo gráfico las curvas correspondientes a los cuatro candidatos, expresándolas en porcentaje sobre los RTs totales para permitir su comparación.

La curva que aparece más ajustada hacia los ejes es la de los retweets recibidos por Albert Rivera y las más alejada la de Pedro Sánchez. Independientemente de lo que cada cual considere retweets masivos o ciberactivismo (nosotros hemos fijado el umbral en los 2 RTs diarios sobre el candidato, 60 al mes), este gráfico permite comparar en qué medida llos líderes de los cuatro principales partidos de España son beneficiados por las cuentas de retuiteo masivo.

El PSOE se perfila como el más beneficiado por las emisiones masivas en Twitter. Esto concuerda con las menciones masivas hacia @sanchezcastejon halladas en el estudio sobre el debate a tres que tuvo lugar el 7 de diciembre de 2015, en el que encontramos cuentas pertenecientes al antiguo Equipo Sugus ejerciendo un agresivo ciberactivismo. El PP es el segundo más beneficiado por los retweets masivos, seguido de PODEMOS y CIUDADANOS en tercer y cuarto puesto.

Las principales cuentas que aparecen como grandes retuiteadoras pertenecientes al ciberactivismo de cada partido (las 20 primeras de cada uno) figuran en la siguiente lista junto al número de RTs que hicieron sobre los candidatos en el período analizado. Obviamente es sólo una muestra, y hay bastantes más.

strong>Hemos encontrando cuentas ciberactivistas en los cuatro principales partidos políticos de España. La proporción de los retweets masivos sobre los RTs totales es mayor en el caso de los partidos tradicionales (PSOE y PP), seguramente para compensar su menor influencia en redes sociales. Hay que hacer notar que en la imagen anterior solamente se están considerando retweets hacia los cuatro candidatos, siendo su volumen de emisiones mucho mayor.

Se constata que los cuatro candidatos son beneficiados por retweets masivos desde cuentas ciberactivistas. El porcentaje de retweets masivos que recibe cada candidato depende el umbral que se fije para considerarlos masivos. Por ejemplo, si tomamos ese umbral como 60 tweets/mes hacia un candidato (ver gráfico), el 40% de los retweets que obtiene Pedro Sánchez (PSOE) procederían del ciberactivismo de su partido; al igual que el 19% de los que obtiene Mariano Rajoy (PP), y el 11% de los que obtienen Pablo Iglesias (PODEMOS) y Albert Rivera (CIUDADANOS). Los candidatos que aparecen más beneficiadas por el retuiteo masivo son precisamente los que obtienen menos RTs en sus tweets. Los porcentajes varían según el umbral que se tome

2. ANÁLISIS DE LOS FAVs

El FAV es otra manera de interactuar puesta a disposición de los usuarios de Twitter. Inicialmente estaba pensado para marcar tweets como favoritos, pero desde finales de 2015 se cambió la habitual estrella por el símbolo de un corazón para unificarlo con el Like de otras redes sociales.

Es utilizado de diferentes formas aunque el uso más generalizado es seguramente para mostrar el acuerdo o agrado por el contenido de un tweet o por quien lo emite. El total de RTs y FAVs alcanzados por un tweet es la suma de estas tres posibilidades:

  • usuarios que han hecho retweet pero no lo marcaron como FAV: hay personas que no acostumbran a utilizar el FAV o sólo lo hacen en contadas ocasiones. También puede darse el caso de que un tweet sea retuiteado aunque no se esté de acuerdo con su contenido.
  • usuarios que han hecho retweet y también marcado como FAV al mismo tiempo: les gusta el tweet (FAV) y lo comparten (RT).
  • usuarios que lo han marcado como FAV pero no lo han retuiteado: en algunos casos el contenido de un tweet ha gustado, pero el usuario no quiere retuitear a la persona que lo ha emitido.

La mayoría de los tweets consiguen más RTs que FAVs, ya que normalmente la primera de las tres posibilidades mencionadas supera a la tercera de ellas. En las siguientes líneas se ven varios ejemplos de tweets en los que sin embargo el número de FAVs ha superado al de RTs. Hemos seleccionado uno de cada candidato.

Este tweet de @pablo_iglesias_ celabrando el nuevo nombre de la coalición para las eleccioens del 26J, consiguió una parte considerable de sus de FAVs (símbolo de corazón) de personas que sin embargo no lo retuitearon (7.916 FAVs frente a 6.713 RT). Una posible explicación es el apoyo al tweet con FAVs por parte de algunas personas pertenecientes a Izquierda Unida, socio de coalición, que sin embargo prefieren no retuitear al lider de PODEMOS.

Algo simliar ocurre con este tweet de @albert_rivera en el que hace mención al tema del terrorismo y homenajea a sus víctimas recibiendo 4.364 FAVs frente a 3.878 RTs. Probablemente ha recibido apoyos en forma de FAVs desde sumpatizantes del Partido Popular u otro partido, y que sin embargo prefieren no retuitearlo.

Otro ejemplo, en este caso de un tweet de @sanchezcastejon emitido como recuerdo hacia el político y activista Pedro Zerolo, muestra nuevamente cómo se puede marcar un tweet como FAV por simpatía hacia su contenido, aunque no se quiera beneficiar con un RT a quien lo emite.

Por último el ejemplo correspondiente a @marianorajoy donde se hace referencia al independentismo y radicalismo, y que también ha conseguido más apoyos en forma de FAV que retweets.

Comparación entre los candidatos

Es interesante establecer el peso que tienen los FAVs en los tweets de cada uno de los candidatos. Hemos calculado en primer lugar el porcentaje de FAVs sobre el total de FAVs y RTs de todos los tweets emitidos por los candidatos en dos períodos: el último mes y lo que va de 2016.

Período 04-05-2016 a 04-06-16 (último mes)

Período 01-01-2016 a 04-06-2016 (desde comienzo de año)

En ambos períodos el candidato que acumula más FAVs y RTs en sus tweets es Pablo Iglesias, dándose la circunstancia de que suman más de el doble de los recibidos por Albert Rivera, situado en segunda posición. Pedro Sánchez y Mariano Rajoy oculpan tercer y cuarto puesto bastante igualados. Estos resultados podrían estar relacionados con el hecho de que el electorado y simpatizantes PSOE y PP se sitúan predominantemente en la población de mayor edad, con menor penetración en redes sociales.

El gráfico de FAVs de los candidatos es muy similar al gráfico de RTs mostrado anteriormente. De hecho, son casi idénticos, ya que el número de RTs y FAVs de un tweet suele ser bastante similar.

Los FAVs y las redes de perfiles falsos (bots)

Hemos visto antes cómo de los retweets era posible extraer información sobre la actividad de RTs masivos que favorecían a los candidatos. De una manera más indirecta (la API de Twitter no permite la extracción de listados de FAVs) es posible detectar casos en los que una cuenta es favorecida por retweets masivos procedentes de redes de perfiles falsos.

Nos valdremos de un hecho que hemos constatado repetidamente: las redes políticas de bots son utilizadas normalmente sólo para hacer retweets, no para emitir FAVs. Sólo en una ocasión encontramos una peculiar red que lo hacía.

Como ejemplo ilustrativo, que además sirva para poder comparar después con los cuatro candidatos, necesitaremos una cuenta que sea retuiteada masivamente por perfiles falsos. Utilizaremos la del conocido y reincidente spammer político @andres_cano42 (Andrés Cano Bonillo, del Partido Popular), que se sirve de una red de casi 50 bots que hacen RT sobre muchos de sus tweets. Desde febrero de 2016 esta red lleva emitidos más de 284.000 tweets.

Aunque fue denunciada por este blog  en mayo de 2016, sigue emitiendo grandes cantidades de spam político destinado a los usuarios de Twitter, sin que desde @TwitterSpain se haya tomado ningún tipo de medida.

Hemos representado los RTs y FAVs recibidos por @andres_cano42 desde enero a junio de 2016.

En este gráfico saltan a la vista dos aspectos que delatan la presencia de retweets masivos hacia @andres_cano42 emitidos desde cuentas de perfil falso:

  • la diferencia entre la cantidad de RTs y FAVs es mucho mayor de lo que sería normal.
  • las curvas de RTs (azul) y FAVs (roja) deberían de estar alineadas, con muy similares fases de crecimeinto y decrecimiento; sin embargo no se aprecia apenas correlación entre ellas.

Estos dos síntomas, cuando son muy evidentes, indican que con gran probabilidad una cuenta es favorecida mediante RTs por redes de perfiles falsos.

El aspecto que presentan las mismas curvas para cada uno de los cuatro candidatos difiere bastante de las de @andres_cano42. Ambas curvas (FAVs y RTs) están alineadas, manteniéndose la diferencia RT ? FAV dentro de unos márgenes que indican que los RTs procedentes de redes de bots no son significativos.

En algunos períodos la media semanal de FAVs (línea roja) es superior incluso a la de RTs indicando abundancia de tweets en los que hay usuarios apoyando con fav, pero sin reenviar, como se vió más arriba.

Los posibles RTs procedentes de redes de cuentas de perfil falso (bots) no son significativos respecto al total de retweets recibidos por los candidatos.

4. INFLUENCIA DE LOS RETWEETS MASIVOS SOBRE CADA CANDIDATO

Los retweets masivos emitidos por cuentas ciberactivistas de partido no muestran un apoyo espontáneo hacia el candidato. Al contrario, es un apoyo incondicional y acrítico repetido artificialmente, y cercano en muchos casos a la propaganda. En este apartado intentaremos aproximarnos al fenómeno de los retweets masivos desde una nueva óptica consistente en cuantificar el número de cuentas únicas que hacen RT sobre cada tweet y compararlo con los RTs que recibe, mostrando los resultados diarios. El volumen de datos necesitado para este tipo de análisis es mayor que antes, por lo que el período de estudio será desde el 04-05-2016 al 04-06-2016, es decir, los últimos 30 días.

Para cada candidato se han confeccionado dos gráficos.  En el de la izquierda se muestran dos líneas:

  • la línea azul: representa la suma de RTs diarios que ha recibido el candidato
  • la línea rosa: es el número de cuentas diferentes que han emitido dichos RTs

Cuanto más próximas y alineadas estén ambas líneas, más representativos son los RTs que recibe el candidato del apoyo espontáneo que recibe en Twitter.  El gráfico de la derecha es el que permite la comparación entre los distintos candidatos al referirse al porcentaje de cuentas únicas sobre el total de RTs. Estos son los resultados para cada candidato:

PEDRO SÁNCHEZ

A partir del 8 de Mayo el porcentaje de cuentas únicas en los RTs sobre la cuenta de @sanchezcastejon cae hasta niveles inferiores al 30%, perdiendo la curva a de cuentas únicas alineación con la curva de retweets. Son signos evidentes de retweets masivos procedentes del equipo de ciberactivistas del PSOE actuando de manera continuada. El carácter espontáneo de los RTs que recibe Pedro Sánchez queda bastante desvirtuado.

MARIANO RAJOY

Retweets masivos de manera discontinua, evidenciados por perdidas de alineamiento entre la curva de cuentas únicas y la curva de retweets. El ciberactivismo se activa a impulsos, lo cual se traduce en los dientes de sierra observados en el gráfico de la derecha. Obsérvese en el gráfico de la izquierda la óptima alineación entre los días 15 y 20 de mayo, período en que hubo poca actividad ciberactivista.

ALBERT RIVERA

Desde el 4 hasta el 23 de mayo los retweets sobre @albert_rivera muestran una baja incidencia de retweets masivos. Sin embargo a partir del día 23 de mayo, coincidiendo con su estancia en Venezuela, la cuenta de Albert Rivera recibió varias decenas de miles de retweets coincidiendo con una drástica caida del porcentaje de cuentas únicas (cuadro de la derecha) que bajó hasta el 30%. Durante esos días se vió beneficiado por los RTs del ciberactivismo opositor a Maduro. Se observa cómo al volver Albert a España los RTs sobre sus tweets caen drásticamente, aumentando el porcentaje de cuentas únicas hasta una media cercana al 70%.

Hemos hecho un pequeño ejercicio consistente en segmentar los retweets recibidos por @albert_ribera el tiempo que estuvo en Venezuela, y también los días anteriores y posteriores. El parámetro elegido para la segmentación es el ?Timezone?, que informa de la zona horaria configurada por las cuentas que emiten los tweets. Dado que es voluntario configurar este parámetro, en muchos casos figura como ?None?, pero en este caso el Timezone servirá de aproximación.  Observando la línea roja se aprecia cómo @albert_rivera comienza el día 23 de mayo a ser retuiteado por cuentas configuradas con la zona horaria ?Caracas? (línea roja), superando estas incluso a las configuradas con la zona horaria ?Madrid? (línea azul). A su vuelta a España dicho fenómeno desaparece.

PABLO IGLESIAS

La curva de cuentas únicas estuvo alineada con la curva de retweets sobre @pablo_iglesias_ durante el período estudiado. En el gráfico derecho se observa que el porcentaje de cuentas únicas no baja del 70%, lo que indica que la cantidad de retweets masivos de los ciberactivistas de PODEMOS no llega a ser significativa frente al total de RTs recibidos por el candidato.

Por último, y para que sirva de comparación, recurriremos nuevamente a la cuenta del influencer del Partido Popular Andrés Cano (@andres_cano42), mostrando los mismos gráficos para el período que va desde el 24/05/16 al 09/06/16 (que son los datos de que disponemos).

>Como era de esperar, las curvas de cuentas únicas y RTs prácticamente no están alineadas y el porcentaje de cuentas únicas oscila en valores que van del 20 al 40%. Estos resultados son coherentes con el hecho de que los tweets de @andres_cano42 son extensamente retuiteados tanto por el ciberactivismo del Partido Popular como por el ciberactivismo opositor en Venezuela.

Mediante esta forma de detectar la actividad ciberactivista han quedado confirmadas las estimaciones obtenidas en el apartado primero sobre en qué medida están afectando, para cada candidato, los retweets masivos procedentes del ciberactivismo de partido al parámetro de los RTs recibidos como métrica para el apoyo espontáneo del candidato en Twitter. Por una vía diferente se vuelve a llegar a la conclusión de que Pedro Sánchez es el candidato más beneficiado por el ciberactivismo, seguido por Mariano Rajoy. El peso de los retweets ciberactivistas estaría bastante igualado para los otros dos candidatos, si bien en parte del período estudiado Albert Ribera se vio beneficiado por los retweets del ciberactivismo opositor venezolano.

4. RESULTADOS

Los retweets (RTs) y favoritos/Likes (FAVs) pueden utilizarse para medir el apoyo hacia un candidato. Dado que una parte de los retweets que reciben los candidatos son RTs masivos fue necesario estimar su porcentaje para cada uno de los candidatos. Estableciendo un umbral exigente de lo que se considera ciberactivismo se calcularon los siguientes porcentajes de retweets masivos durante el período estudiado: Pedro Sánchez (40%), Mariano Rajoy (19%), Pablo Iglesias y Albert Rivera (ambos 11%). Una vez descontados de las cantidades respectivas de retweets el resultado es el siguiente:

>Hay que hacer notar que la elección del umbral de lo que se considera ciberactivismo (60 tweets/mes sobre el candidato) podría haber sido cualquier otra sin afectar a las posiciones relativas de los candidatos en los resultados finales.

Utilizando el número de retweets y favoritos/likes como medida del apoyo de los usuarios de Twitter hacia los candidatos y después de descontar los retweets masivos procedentes del ciberactivismo de partido, el candidato que recibe más apoyo de los usuarios de Twitter ha resultado ser Pablo Iglesias siendo destacable la gran diferencia que le separa de los otros tres candidatos. En segundo lugar por apoyo recibido lo obtivo Albert Ribera y la tercera posición fue para Mariano Rajoy. El candidato Pedro Sánchez ha quedado en último lugar dado el alto nivel de retweets masivos que una vez descontados le colocaron en apoyo real por debajo de Mariano Rajoy.

Estaríamos encantados en recibir opiniones, sugerencias, críticas razonadas y cualquier tipo de realimentaición de los lectores sobre este estudio.

Si te ha parecido interesante puedes difundirlo en redes sociales y sitios web agregadores de noticias.

nuestra cuenta en twitter: @BotsPoliticosNo

Reproducido de BotsPoliticosNo


pdfprintpmail