Tecnologías de la Información y Telecomunicaciones

Desarrollan un sistema basado en inteligencia artificial para identificar las emociones en Twitter

Un equipo de investigación de la Universidad de Jaén aplica este método para reconocer el estado de ánimo de los usuarios de esta red social en castellano. Los expertos utilizan la tecnología para recopilar, analizar y clasificar mensajes escritos y orientan los datos obtenidos a la detección de problemas de salud mental o trastornos de la alimentación.

Jaén |

11 de noviembre de 2020

Un equipo de investigación de la Universidad de Jaén ha desarrollado un sistema basado en inteligencia artificial para reconocer las emociones de los usuarios en Twitter. Esta tecnología, aplicada por primera vez al idioma castellano, percibe el estado anímico de las personas que escriben mensajes en la red social, los analiza y clasifica. Los investigadores orientan la información obtenida a áreas como la detección de la depresión, de anorexia y bulimia o el lenguaje abusivo y violento, entre otros ámbitos.

En este trabajo, los investigadores han entrenado el sistema de un ordenador con una serie de tuits ya recopilados e interpretados con anterioridad en el idioma español

Las tecnologías del lenguaje humano son una rama de la inteligencia artificial que se centra en el estudio de sistemas computacionales que son capaces de comprender y generar lenguaje. Este ámbito está relacionado con el aprendizaje automático (machine learning), que es la capacidad de un software o una máquina para identificar y aprender patrones complejos en forma de algoritmos matemáticos de manera autónoma.

Los expertos aplican esta tecnología a un conjunto de datos compuestos por tuits previamente recopilados y analizados por humanos con el fin de detectar emociones en el texto. Además, enseñan a la máquina cómo interpretar nuevos términos en castellano incorporando diccionarios y lexicones al sistema. “Esta tecnología puede aplicarse a ámbitos diversos con la finalidad de detectar problemas de salud mental o violencia verbal.”, explica a la Fundación Descubre Flor Miriam Plaza, co-autora de este estudio e investigadora de la Universidad de Jaén.

En el estudio titulado ’Improved emotion recognition in Spanish social media through incorporation of lexical knowledge’ y publicado en la revista Future Generation Computer Systems, los expertos entrenan el sistema de un ordenador con una serie de tuits ya recopilados e interpretados con anterioridad en el idioma español. De este modo, genera un modelo de lenguaje que le permite reconocer emociones tales como el enfado, el miedo, la alegría y la tristeza. “Es un trabajo complejo porque no se trata de una clasificación binaria de emociones negativas y positivas. Hay muchos matices para detectar la alegría, la tristeza o la sorpresa, por ejemplo”, comenta María Teresa Martín, investigadora de la Universidad de Jaén.

Detección de las emociones

Una vez integrada esta información básica en el sistema, los investigadores incluyeron palabras nuevas de diccionarios y palabras nuevas para ampliar la cantidad de matices que ésta pudiera percibir e incrementar su precisión. Esta enseñanza paulatina de lenguaje, independiente de la base de datos previamente desarrollada, tenía la finalidad de mejorar la efectividad del sistema. Tras detectar el tuit, el sistema lo analiza y le asigna una emoción en base al modelo de lenguaje generado, en este caso, el castellano. Por ejemplo: “Primer disgusto del día. Me acaban de comunicar un robo en el colegio. Se han llevado, al menos, un ordenador. Suma y sigue, por desgracia” el sistema identifica enfado.

Equipo de investigación que ha realizado este trabajo.

Los expertos observaron en este estudio que la emoción más representada en los tuits era la alegría porque era más fácil de detectar para el sistema que el enfado, el miedo o la tristeza, que poseen mayores matices. El investigador de la Universidad de Jaén Luis Alfonso Ureña explica: “No es un proceso perfecto porque esta tecnología no percibe con claridad figuras del lenguaje como la ironía, el sarcasmo o las frases hechas y, además, se generan nuevas expresiones continuamente. Para perfeccionar este sistema, hay que ‘enseñar’ a la máquina continuamente en un idioma concreto, como el castellano de España o el inglés británico”.

En estudios previos, el grupo Sistemas de Acceso Inteligente a la Información puso el foco en la detección de la anorexia y la bulimia y el lenguaje misógino y xenófobo en redes sociales. “Nuestro equipo de investigación se centra en las tecnologías del lenguaje humano aplicado, entre otras áreas, al análisis de sentimientos en español. En el futuro, queremos mejorar la tecnología basada en inteligencia artificial y aprendizaje automático que utilizamos para aplicarla a una mayor variedad de ámbitos”, comenta Luis Alfonso Ureña.

Esta investigación ha sido financiada por los fondos propios del grupo de investigación Sistemas de Acceso Inteligente a la Información, por el Fondo Europeo de Desarrollo Regional (FEDER), el proyecto LIVING-LANG y el proyecto REDES del Gobierno español.

Referencias

Plaza del Arco, F.M; Martín-Valdivia, M.T.; Ureña López, L.A.; Ruslan, M. (2020). ’Improved emotion recognition in Spanish social media through incorporation of lexical knowledge’. Future Generation Computer Systems 99 (2020) 454–464.

Más información:

#CienciaDirecta, agencia de noticias de ciencia andaluza, financiada por la Consejería de Transformación Económica, Industria, Conocimiento y Universidades de la Junta de Andalucía.

Teléfono: 954 232 349

E-mail: comunicacion@fundaciondescubre.es

Documentación adicional

Equipo de investigación

Flor Miriam Plaza, co-autora del estudio

Teclado ordenador

Dos personas usando sus móviles

Últimas publicaciones

Arqueología

La primera excavación en la Villa de Bruto confirma la monumentalidad de este complejo romano de Tívoli

Sevilla | 22 de julio de 2026

Un estudio dirigido por la Universidad Pablo de Olavide ha permitido contrastar sobre el terreno varias hipótesis planteadas mediante georradar y documentación digital, además de aportar nuevos datos sobre los jardines y una gran piscina circular.

Sigue leyendo

Recursos Naturales y Medio Ambiente

La reinundación del mar de Aral podría evitar emisiones masivas de dióxido de carbono

Málaga | 22 de julio de 2026

Un estudio en el que participa la Universidad de Málaga demuestra que el lecho desecado del mar de Aral -situado en Asia Central, exactamente en la frontera entre Kazajistán (al norte) y Uzbekistán (al sur) es un componente clave del balance de carbono en este continente y una oportunidad de mitigación climática que ha pasado en gran medida desapercibida.

Sigue leyendo

Ciencias de la Salud

Comparan dos estrategias avanzadas de entrenamiento de fuerza para medir su progresión en deportistas

Málaga | 21 de julio de 2026

Científicos del Área de Educación Física y Deportiva de la Facultad de Medicina de la Universidad de Málaga han liderado un estudio internacional que compara dos estrategias avanzadas de entrenamiento de fuerza, muy utilizadas por entrenadores, para medir su progresión en deportistas con relación a la ganancia de masa muscular, fuerza máxima y cambios en la composición corporal.

Sigue leyendo

#CienciaDirecta

Tu fuente de noticias sobre ciencia andaluza

Más información Suscríbete

¿ERES CIENTÍFICO/A Y QUIERES DIFUNDIR TUS RESULTADOS? CONTÁCTANOS

¿QUIERES CONTACTAR CON UN CIENTÍFICO/A? CONSULTA LA GUÍA EXPERTA

Política de cookies

Este sitio web utiliza cookies para mejorar su experiencia mientras navega por el sitio web. De estas, las cookies que se clasifican como necesarias se almacenan en su navegador, ya que son esenciales para el funcionamiento de las funcionalidades básicas del sitio web. También utilizamos cookies de terceros que nos ayudan a analizar y comprender cómo utiliza este sitio web. Estas cookies se almacenarán en su navegador solo con su consentimiento. También tiene la opción de optar por no recibir estas cookies. Pero la exclusión voluntaria de algunas de estas cookies puede afectar su experiencia de navegación.

Necesarias

Siempre activado

Las cookies necesarias son absolutamente esenciales para que el sitio web funcione correctamente. Esta categoría solo incluye cookies que garantizan funcionalidades básicas y características de seguridad del sitio web. Estas cookies no almacenan ninguna información personal.

Cookie	Duración	Descripción
CONSENT	16 años 7 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. La cookie se utiliza para almacenar el consentimiento del usuario para las cookies.
cookielawinfo-checkbox-advertisement	1 año	La cookie se establece mediante el consentimiento de cookies de GDPR para registrar el consentimiento del usuario para las cookies en la categoría "Publicidad".
cookielawinfo-checkbox-analytics	1 año	Estas cookies están configuradas por el complemento de WordPress de consentimiento de cookies de GDPR. La cookie se utiliza para recordar el consentimiento del usuario para las cookies en la categoría "Análisis".
cookielawinfo-checkbox-necessary	1 año	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "Necesarias".
cookielawinfo-checkbox-performance	1 año	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. La cookie se utiliza para almacenar el consentimiento del usuario para las cookies en la categoría "Rendimiento".
JCS_INENREF	1 hora	La cookie es parte de las medidas de seguridad del sitio web y se utiliza con fines antispam.
JCS_INENTIM	1 hora	La cookie es parte de las medidas de seguridad del sitio web y se utiliza con fines antispam.
PHPSESSID	sessión	Esta cookie es nativa de las aplicaciones PHP. La cookie se utiliza para almacenar e identificar la identificación de sesión única de un usuario con el fin de administrar la sesión del usuario en el sitio web. La cookie es una cookie de sesión y se elimina cuando se cierran todas las ventanas del navegador.

Rendimiento

Las cookies de rendimiento se utilizan para comprender y analizar los índices de rendimiento clave del sitio web, lo que ayuda a brindar una mejor experiencia de usuario a los visitantes.

Cookie	Duración	Descripción
_gat	1 minuto	Google Universal Analytics instala estas cookies para acelerar la tasa de solicitud y limitar la recopilación de datos en sitios de alto tráfico.
YSC	sessión	Estas cookies son establecidas por Youtube y se utilizan para rastrear las vistas de videos incrustados.

Analítica

Las cookies analíticas se utilizan para comprender cómo los visitantes interactúan con el sitio web. Estas cookies ayudan a proporcionar información sobre métricas, el número de visitantes, la tasa de rebote, la fuente de tráfico, etc.

Cookie	Duración	Descripción
_ga	2 años	Esta cookie es instalada por Google Analytics. La cookie se utiliza para calcular los datos de visitantes, sesiones y campañas y realizar un seguimiento del uso del sitio para el informe de análisis del sitio. Las cookies almacenan información de forma anónima y asignan un número generado aleatoriamente para identificar visitantes únicos.
_gid	1 día	Esta cookie es instalada por Google Analytics. La cookie se utiliza para almacenar información sobre cómo los visitantes usan un sitio web y ayuda a crear un informe analítico de cómo está funcionando el sitio web. Los datos recopilados, incluido el número de visitantes, la fuente de donde provienen y las páginas visitadas de forma anónima.

Las cookies publicitarias se utilizan para proporcionar a los visitantes anuncios y campañas de marketing relevantes. Estas cookies rastrean a los visitantes en los sitios web y recopilan información para proporcionar anuncios personalizados.

Cookie	Duración	Descripción
IDE	1 año 24 días	Utilizado por Google DoubleClick y almacena información sobre cómo el usuario utiliza el sitio web y cualquier otro anuncio antes de visitar el sitio web. Se utiliza para presentar a los usuarios anuncios que son relevantes para ellos de acuerdo con el perfil del usuario.
ms-uid	1 año	Estas cookies tienen una finalidad publicitaria. Contienen un valor único generado aleatoriamente que permite a la Plataforma distinguir navegadores y dispositivos. Esta información se utiliza para medir el rendimiento de los anuncios y proporcionar recomendaciones de productos basadas en datos.
NID	6 meses	Esta cookie se utiliza para crear un perfil en función del interés del usuario y mostrar anuncios personalizados a los usuarios.
test_cookie	15 minutos	Esta cookie la establece doubleclick.net. El propósito de la cookie es determinar si el navegador del usuario admite cookies.
VISITOR_INFO1_LIVE	5 meses 27 días	Youtube establece esta cookie. Se utiliza para rastrear la información de los videos de YouTube incrustados en un sitio web.