Análisis automático de sentimiento en tuits de política de Honduras

Autores/as

  • Nicole Rodríguez Alcántara Facultad de Ingeniería, Universidad Tecnológica Centroamericana, UNITEC, San Pedro Sula, Honduras
  • Angella Falck Durán Facultad de Ingeniería, Universidad Tecnológica Centroamericana, UNITEC, San Pedro Sula, Honduras
  • Sergio Antonio Suazo Barahona Facultad de Ingeniería, Universidad Tecnológica Centroamericana, UNITEC, Tegucigalpa, Honduras

DOI:

https://doi.org/10.5377/innovare.v11i3.15349

Palabras clave:

Análisis de sentimiento, Aprendizaje de maquina supervisado, Política de Honduras, Procesamiento de lenguaje natural, Twitter

Resumen

Introducción. Twitter se ha convertido en un medio de expresión política ciudadana, transmitiendo sentimientos y opiniones de los usuarios mediante tuits. Analizar estos datos permite conocer tendencias y puntos de inflexión en los criterios políticos. El objetivo del estudio fue desarrollar un proceso de análisis automático de sentimiento en tuits de política de Honduras, mediante técnicas de aprendizaje de máquina supervisado. Métodos. Se efectuó una recolección de 1,800 tuits de política hondureña mediante filtros basados en usuarios y hashtags en un periodo de enero a septiembre de 2022, seguido de un etiquetado manual de tuits. Se aplicaron las técnicas de procesamiento de lenguaje natural: Bolsa de Palabras (BOW, siglas en inglés) y frecuencia de término-frecuencia inversa de documento (TF-IDF, siglas en inglés). Los métodos considerados fueron SVM lineal, regresión logística y Naive Bayes multinomial (MNB). Las métricas de rendimiento para la comparación de clasificadores fueron el valor-F (F1), la exactitud y los tiempos de entrenamiento y de validación. Resultados. El modelo seleccionado fue el MNB por su mayor frecuencia de término (F1) (62.48%) y menor tiempo de entrenamiento. Mientras que SVM lineal obtuvo 61.80% y regresión logística 61.34%. El rendimiento final del MNB con tuits nuevos fue de 63.37% de F1. Conclusión. Para el conjunto de datos presentado, se obtuvo que el mejor clasificador fue MNB. Sin embargo, la brecha de rendimiento entre clasificadores es reducida, lo que implica que optimizaciones de preprocesamiento y debe considerarse una colección de datos a mayor escala.

Descargas

Los datos de descargas todavía no están disponibles.
Resumen
204
HTML 56
PDF 175

Descargas

Publicado

2022-12-08

Cómo citar

Rodríguez Alcántara, N. ., Falck Durán, A. ., & Suazo Barahona, S. A. . (2022). Análisis automático de sentimiento en tuits de política de Honduras . Innovare: Revista De Ciencia Y tecnología, 11(3), 158–165. https://doi.org/10.5377/innovare.v11i3.15349

Número

Sección

Artículos originales