Un proyecto de investigación conjunta de la UCLA y los laboratorios de Hewlett-Packard desarrolló un algoritmo, que incluye factores como el tema de un artículo y una fuente para determinar su popularidad en Twitter, que tiene una precisión del 84% para determinar que comentario será un hit en la red social.
Según Roja Bandari, Sitram Asur y Bernardo Huberman, promotores de la iniciativa, también han asegurado con un 66% de certeza que artículo no tendrá ningún retweet.
La popularidad social de un artículo se mide según el número de veces que una dirección URL es publicada y compartida en Twitter.
Los investigadores indicaron que para la búsqueda del “tweet perfecto” se basaron en cuatro aspectos:
- La fuente de noticias que generan los mensajes del artículo
- La categoría de noticias de este artículo utiliza
- La subjetividad de la lengua en el artículo
- Los nombres de las entidades mencionadas en el artículo
“Para cuantificar cada una de estas características en un marcador hicimos uso de diferentes funciones de puntuación. A continuación, utilizamos estos resultados para generar predicciones de la propagación de los artículos de noticias que utilizan métodos de regresión y clasificación”, informaron los científicos.
“Nuestros experimentos muestran que es posible estimar los rangos de popularidad con una precisión global de 84 por ciento teniendo en cuenta sólo las características de contenido. Además, mediante la comparación con un índice de fuentes de noticias independientes, demuestran que existe un marcado contraste entre las fuentes de noticias tradicionales y populares de los propagadores de noticias importantes de la web social”, agregaron.
Sitios como Mashable, el blog del dueño de Dallas Maverick o el sitio oficial de Google tienen más éxito en la generación de tráfico de Twitter que páginas web de noticias como el The New York Times, The Wall Street Journal, o Reuters.
Sin embargo, los investigadores encontraron que la clasificación de categoría de noticias en su algoritmo de “no tuvo un buen desempeño” como un factor predictivo por sí solo.