Y es que tus conversaciones en Twitter y el comportamiento que sigas en esta red social sirve para que este algoritmo detecte con un 70% de eficacia desde qué ciudad y provincia escribes. La herramienta, que podríamos pensar que interfiere con nuestra privacidad, ayuda a los investigadores a analizar la distribución geográfica de los mensajes de Twitter desde diferentes perspectivas.
Su trabajo ha sido publicado en arXiv, y se basó en la recopilación de tuits de julio a agosto de 2011 de usuarios de las 100 ciudades más grandes de Estados Unidos en términos de población. A partir de ahí, captaron los 200 últimos mensajes de los usuarios, de forma que su investigación analizó finalmente más de 1 millón y medio de mensajes en Twitter enviados por casi 10.000 usuarios.
Del total de tuits, el 6,6% eran fáciles de geolocalizar, pues procedían directamente de la red Foursquare. El 19% de los mensajes, por otro lado, contenían referencias directas a las ciudades donde estaban situados los usuarios. A partir de ahí, los investigadores desarrollaron un algoritmo en el que usaban diversos términos para geolocalizar los mensajes, tales como hashtags, nombres de ciudades u otras palabras clave.
Finalmente, para validar la relación entre la geolocalización inferida por el algoritmo y la localización real, los investigadores compararon datos como la hora de los envíos de los mensajes en Twitter y la franja horaria de las ciudades donde estarían los usuarios. Sin duda, el poder del big data generado en redes sociales como esta puede ayudarnos a recopilar numerosa información, solo hace falta saber cómo almacenar y gestionar todos estos datos.