Política de Cookies

El sitio web de la Universidad de Extremadura utiliza cookies propias y de terceros para realizar análisis de uso y medición del tráfico, así como permitir el correcto funcionamiento en redes sociales, y de este modo poder mejorar su experiencia de navegación.

Si desea configurar las cookies, pulse el botón Personalizar Cookies. También puede acceder a la configuración de cookies en cualquier momento desde el enlace correspondiente en el pie de página.

Para obtener más información sobre las cookies puede consultar la Política de cookies del sitio web de la Universidad de Extremadura.

Personalización de Cookies

El sitio web de la Universidad de Extremadura utiliza cookies propias y de terceros para realizar análisis de uso y medición del tráfico, así como permitir el correcto funcionamiento en redes sociales, y de este modo poder mejorar su experiencia de navegación.

Para obtener más información sobre las cookies puede consultar la Política de cookies del sitio web de la Universidad de Extremadura. También puede acceder a la configuración de cookies en cualquier momento desde el enlace correspondiente en el pie de página.

A continuación podrá configurar las cookies del sitio web según su finalidad:

  • Análisis estadístico

    En este sitio se utilizan cookies de terceros (Google Analytics) que permiten cuantificar el número de usuarios de forma anónima (nunca se obtendrán datos personales que permitan identificar al usuario) y así poder analizar la utilización que hacen los usuarios del nuestro servicio, a fin de mejorar la experiencia de navegación y ofrecer nuestros contenidos de manera óptima.

  • Redes sociales

    En este sitio web se utilizan cookies de terceros que permiten el correcto funcionamiento de algunas redes sociales (principalmente Youtube y Twitter) sin utilizar ningún dato personal del usuario.

Nuevo modelo más preciso de IA detecta mensajes de odio en español en las redes sociales

Carlos J Pérez Jesús M Sánchez Gomez Miguel A Vega Rodríguez Universidad de Extremadura

  • Investigadores de la Universidad de Extremadura (UEx) han desarrollado SHS-ALBETO, un sistema basado en Inteligencia Artificial (IA) que mejora la detección automática de mensajes de odio en redes sociales en español, superando en precisión y tiempo los métodos actuales

10/12/2025. La proliferación online de mensajes ofensivos y discursos de odio supone un desafío urgente. Aunque las plataformas intentan frenarlo, sigue siendo difícil detectar estos mensajes automáticamente, especialmente en idiomas distintos del inglés, como el español. Es por ello que investigadores de la Escuela Politécnica de la UEx han desarrollado SHS-ALBETO, Spanish Hate Speech detection with ALBETO, modelo basado en la arquitectura BERT, entrenado exclusivamente en español.

BERT (Bidirectional Encoder Representations from Transformers por sus siglas en inglés) es un modelo de IA creado por Google en 2018 para que las máquinas entiendan el lenguaje humano. El modelo ALBETO, nombre derivado de ALBERT y A Lite BERT (una versión ligera de BERT), emplea lenguaje ligero que, en el contexto de modelos de IA, significa que necesita menos recursos de cómputo y entrena más rápido, sin sacrificar rendimiento, lo que lo convierte en ideal para aplicaciones en tiempo real.

SHS-ALBETO es un modelo de aprendizaje profundo o deep learning basado en Transformers, una tecnología avanzada de procesamiento del lenguaje natural basada en redes neuronales diseñadas para entender el contexto de las palabras en un texto mediante un mecanismo de auto-atención o self-attention. Esta técnica permite que el sistema analice cada palabra de un texto considerando su relación con todas las demás palabras de la frase y, además, mejora la comprensión del contexto, esencial para detectar ironía, sarcasmo o lenguaje ambiguo.

Los investigadores de la UEx han entrenado y ajustado SHS-ALBETO con datos reales de la red social X, “para ver si podía mejorar la detección de mensajes de odio frente a otras soluciones existentes. También buscábamos comparar su desempeño con modelos previos basados en la arquitectura BERT, como BETO o DistilBETO, evaluando si su enfoque lograba resultados superiores”, anuncia Carlos Javier Pérez Sánchez, catedrático en el área de Matemáticas en la Escuela Politécnica de la UEx.

En particular, “hemos empleado el conjunto HatEval del concurso SemEval 2019, que contiene unos 6.600 tuits en español etiquetados como discurso de odio o no odio. Este conjunto de datos se centra en mensajes de odio contra dos colectivos, mujeres e inmigrantes”, explica Pérez Sánchez.  SemEval (Semantic Evaluation) es una competición anual que reúne a investigadores de todo el mundo para evaluar y comparar sistemas automáticos que entienden y procesan el lenguaje humano.

El modelo SHS-ALBETO ha logrado resultados muy destacados. En primer lugar, destaca la eficiencia del modelo de la UEx. Está construido sobre ALBETO, una versión optimizada de BERT, y es un sistema más preciso y también más ligero que los anteriores. A su vez, el sistema detectó más mensajes de odio correctamente en español y con menos errores que las soluciones anteriores, estableciendo un nuevo referente en la detección de odio en español. En el conjunto de prueba (tuits de HatEval), obtuvo una puntuación F1 cercana a 0.78, claramente superior a la de cualquier modelo previo (que rondaban F1 ≈ 0.70–0.72). Y desde una comparativa de tipo cuantitativo, los investigadores de la UEx destacan que SHS-ALBETO mejoró en torno a un 10% las métricas clave de precisión, sensibilidad y exactitud frente a modelos competidores como BERT multilingüe o BETO.

 

Aplicación práctica de SHS-ALBETO

La mejor precisión y eficiencia de SHS-ALBETO lo convierten en un buen complemento para reforzar los filtros automáticos existentes en entornos digitales y redes sociales en español, un idioma que plantea desafíos particulares en la detección de lenguaje de odio.

Existe una escasez de datos y recursos dedicados al español. Se ha prestado mucha más atención al inglés, lo que dificulta la investigación y entrenamiento de buenos modelos. Además, el español es muy diverso, tiene variaciones dialécticas entre regiones que complican el análisis uniforme del texto. Estas diferencias y la falta de grandes corpus etiquetados en español afectan la precisión y robustez de los sistemas.

La herramienta SHS-ALBETO puede ayudar a redes sociales y comunidades online a eliminar o moderar contenidos ofensivos o de odio rápidamente, impidiendo que alcance a más usuarios o se vuelva viral.

“Los medios digitales lo podrían aplicar para controlar mejor los comentarios ofensivos que escapan a sus actuales mecanismos. Y en el caso de instituciones públicas, educativas o entidades que luchan contra la discriminación, SHS-ALBETO facilitaría la monitorización de tendencias o incidentes de odio en tiempo real, ayudando a reaccionar antes y con más información”, apunta el catedrático de la UEx.

Audio Jesús M. Sánchez-Gómez

Referencia bibliográfica

Jesus M. Sanchez-Gomez, Fernando Batista, Miguel A. Vega-Rodríguez, Carlos J. Pérez. A transformer-based deep learning approach for detecting online hate speech in Spanish, Applied Soft Computing, Volume 187, 2026, 114259, ISSN 1568-4946. https://doi.org/10.1016/j.asoc.2025.114259

Fuente: Servicio de Difusión de la Cultura Científica de la UEx

Carlos J Pérez Jesús M Sánchez Gomez Miguel A Vega Rodríguez Universidad de Extremadura