31 octubre, 2018
[Informe] Escucha social: “El Subte en Twitter”
Índice
Escucha social: “El Subte en Twitter”
Comprendiendo la importancia que tienen los medios digitales hoy en día para nuestro proyecto, desde Subte.data nos propusimos conocer la conversación que existe en torno al servicio de Subte dentro de la Red Social Twitter. A raíz de esta inquietud se planteó una serie de preguntas disparadoras que permitiesen realizar un abordaje íntegro sobre la cuestión: ¿Cuántos usuarios escriben en Twitter sobre el Subte?, ¿cuáles son los principales motivos por los cuales escriben?, ¿cómo pueden interpretarse esos motivos?, ¿en qué medida se utiliza como herramienta de descargo, recreación, etc.?
La temporalidad de la recolección de los datos se estableció en la totalidad del mes de agosto de 2018, mes en el cual tuvieron lugar dos sucesos de importancia que marcaron la conversación de forma contundente: el primer aumento de tarifa del año y la votación en el Senado de la Nación por la Ley de Interrupción Voluntaria del Embarazo. De esta forma fue posible observar de qué manera Twitter funciona no solo para manifestarse a favor o en contra de distintas medidas que directamente afecten al servicio sino también como medio canalizador de relatos de la vida cotidiana que giran alrededor de toda la Red.
Una vez establecidos los parámetros obtuvimos como resultado un total de 56.309 menciones (tweets) realizadas por 47.200 usuarios. En promedio, esto implica 1.12 menciones por mes promedio por usuario. El 73% de toda la conversación se encuentra compuesta por retweets (41.242 RT’s) mientras que el 27% restante por tweets y respuestas (9.646 tweets y 5.421 Replys).
Lo siguiente en determinar fue la cantidad de contenido que no fuese considerado como relevante a los fines de los objetivos planteados. Fue así como se determinó, en primer lugar, un criterio que permitiese identificar las cuentas consideradas como Trolls y Bots en función de comportamientos tales como los horarios irregulares en el cual twittean y/o la heterogeneidad del contenido que comparten y comentan, es decir, cuentas que no demuestran mantener cierta coherencia o conjunto claro de intereses como un usuario promedio. Se identificaron 50 usuarios con estas características que generaron 1.110 menciones.
En segundo lugar, aislamos aquellas cuentas que se encargan de difundir constantemente información sobre el servicio de Subte, ya sea como contenido propio o a través de retweets que realizan automáticamente a través del uso de palabras claves. En este caso fueron identificadas 30 cuentas que generaron 1.151 menciones.
Al filtrar el contenido de estas cuentas halladas nos quedamos con un universo de análisis de 54.048 menciones compuestos de la siguiente manera:
Tomando en cuenta este universo, en el cual los Retweets tienen una participación preponderante con el 76% sobre el total, el contenido con mayor amplificación resultan ser aquellos relacionados con historias (verídicas o no) que suceden alrededor del Subte o repercusiones por algún tweet que relata la convivencia entre los usuarios del servicio, especialmente durante la primera quincena del mes cuando tuvo lugar el tratamiento de la Ley de Interrupción Voluntaria del Embarazo.
De hecho, los contenidos con mayor repercusión en Twitter no tienen una relación directa con el Subte sino que hacen mención del medio de transporte como escenario o punto de encuentro respecto del relato principal. Los cinco tweets con mayor repercusión tienen un rango de reacciones de entre 4.000 y 8.000 retweets.
Ante estos datos contundentes surgió la pregunta respecto de qué ocurre dentro del 24% restante de contenido, ¿se tratan solamente de relatos de la vida urbana?, ¿qué ocurre con el contenido que no tiende a ser tan amplificado?
De esta manera, abstrayendo los retweets del análisis nos quedamos con un nuevo universo de contenido para analizar que se compone únicamente de lo que llamamos “menciones netas”, el cual adoptó la siguiente forma:
Si bien ya se tenía anticipado desde el resultado anterior que se iban a trabajar con 13.061 menciones, en cuanto al número de usuarios se observa un decrecimiento proporcional al universo general de menciones (de 47.200 a 11.800 usuarios) dado que el promedio de tweets por usuario se mantiene en 1.1 menciones mensuales. También llama la atención la proporción del 41% de respuestas (reply’s) existentes, lo cual permite establecer el hecho de que buena parte del contenido neto es producido por la interacción entre los usuarios.
Ahora bien, en tanto nuestra inquietud pasó a una instancia en la cual se buscó conocer con mayor especificidad el tipo de contenido que crearon los usuarios y siendo que el análisis del universo completo implicaba una prolongación en los tiempos del trabajo, se decidió tomar una muestra representativa de ese universo que permitiese evaluar este objetivo con una aproximación considerable.
De esta forma, se obtuvo una muestra de 1009 casos mediante un muestreo aleatorio realizado al universo de menciones netas, estableciendo como requisitos un 3% de margen de error y un 95% de nivel de confianza. El resultado, una vez trabajada la categorización de los casos, fue el siguiente:
Del total de la muestra, 321 menciones apuntaron a remarcar de forma negativa algún aspecto sobre el servicio, seguido de cerca por relatos de la vida urbana que los usuarios vivenciaron alrededor del Subte con 302 menciones. En tercer lugar se ubican las diferentes historias sobre la convivencia en el Subte, fuertemente marcada (pero no únicamente) por el cruce de valoraciones entre personas a favor o en contra de la Ley de Interrupción Voluntaria del Embarazo.
El cuadro se completa con 98 tweets que hablan sobre el estado del servicio, 49 que cuentan o comentan distintas situaciones extraordinarias que ocurrieron en el Subte y, por último, 32 menciones que realizan una valoración positiva de algún aspecto relacionado al medio de transporte.
En términos proporcionales, estos números adquieren la siguiente forma:
Como indica el gráfico, las menciones cargadas de una valoración negativa forman casi la tercera parte del total de la muestra (32%) mientras que otra tercera parte se compone por relatos de la vida urbana (30%).
Las formas de Convivencia ocupan el 20% del total, mientras que el 10% de las menciones tratan sobre información del servicio. El resto de los tweets tratan de situaciones curiosas (5%) y valoraciones positivas (3%).
Es de destacar que si bien las Valoraciones Negativas representan el principal motivo de menciones netas relacionadas directamente con el Subte, el grado de amplificación (retweet’s) con el que éstas cuentan es más baja que aquellas en donde se menciona al Subte de forma accesoria al motivo principal.
Esta característica, establecida a partir de la muestra, da lugar a interpretar el grado de importancia que tiene esta red social como una herramienta de descargo de los usuarios de Subte, en simultaneidad con el uso ocioso o por razones sociales.
La manifestación de disconformidades hacia el servicio, en definitiva, es moneda corriente entre los usuarios y se expresa a través de una multiplicidad de causas distintas. Por tal motivo decidimos realizar una subcategorización de estas menciones para constatar éstas inquietudes:
En primer lugar puede verse cómo la temática del cambio en la tarifa del servicio ocupa un lugar destacado entre los usuarios dado que el 25% de las menciones negativas tuvieron que ver con descargos ante el aumento que hubo a partir del 3 de agosto.
En segundo lugar, el 19% de los tweets fueron expresiones que apuntaron expresamente a reclamar por la mala frecuencia. Por otro lado, las quejas globales agrupan a aquellas menciones negativas que no critican algún aspecto en particular sino que establecen un disgusto al Subte en general.
Los conflicto gremiales ocurridos durante el mes de agosto ocuparon el 11% de la conversación negativa, mientras que la Línea E adquirió una posición destacada por sobre las demás líneas, concentrando el 9% del total de las menciones negativas.
La proporción restante se completa con los reclamos por la saturación de gente a la hora de querer utilizar el servicio con el 9% de las menciones, los comentarios que interpelan en forma directa tanto a algún funcionario de Gobierno como a las instituciones que están involucradas con el manejo del servicio con el 7% y los diferentes problemas por falta de accesibilidad con el 4%.
Comentarios finales
Dentro del paradigma del accountability existen distintas vías formales e informales que permiten medir la relación entre los ciudadanos con su Gobierno en tanto forma de evaluación de la efectividad de un servicio. Desde Subte.data, en base a la temática que nos compete sobre el seguimiento del Subte como transporte público, consideramos que una de esas formas es el análisis de la conversación que sucede en Twitter, la cual cristaliza en tiempo real distintas manifestaciones de los usuarios que se encuentran al margen de los mecanismos formales de reclamos y sugerencias del servicio. En definitiva, el presente trabajo tuvo como principal motivación poder establecer pasos concretos en el diseño de evaluación del servicio que ofrece el concesionario Metrovías, posicionando la configuración de la conversación que se da en las redes sociales como parte de un todo compuesto por distintos instrumentos fiscalizadores.
En ese sentido, a partir de una serie de preguntas problema inicial se pudo determinar un universo de menciones de Twitter de forma tal que permitiese establecer un abordaje inicial sobre los principales temas que configuraron la conversación durante el mes de agosto, filtrando las publicaciones de aquellas cuentas que podrían llegar a “mancharla”.
Una primera parte de los resultados demostró que, por un lado, el contenido que más reacciones provoca no suele tener una relación directa con el Subte. Lo más reproducido y replicado suele estar vinculado con historias de la vida urbana que, en este caso en particular, hace mención del Subte de manera subsidiaria, generalmente como escenario princiap en el que tiene lugar dicho relato.
Sin embargo, en cuanto se realizó una abstracción del contenido que únicamente se dedica a replicar otro contenido original (es decir, los retweets), obteniendo como resultado un universo de “menciones netas”, se estableció una muestra representativa que permitiese determinar cuáles son las principales temáticas dentro de la conversación. Una vez analizado, se pudo observar una mayoría de contenido neto compuesto por manifestaciones cargadas de valoraciones negativas hacia el servicio, el cual se desagregó para conocer en mayor detalle.
Esperamos que este análisis sirva para profundizar las formas de evaluación del servicio, de forma tal que se puedan generar herramientas que instalen una mayor consideración de la conversación que tiene lugar en los distintos medios digitales. Está dentro de nuestro propósitos continuar con éste análisis para poder generar una vinculación con los distintos datos abiertos disponibles de los cuales nos basamos para poder realizar nuestra tarea diaria.
Escucha Social: “El Subte en Twitter”
Análisis realizado con el soporte de