VOLVER

Share

Desarrollan un sistema basado en inteligencia artificial para identificar las emociones en Twitter

Un equipo de investigación de la Universidad de Jaén aplica este método para reconocer el estado de ánimo de los usuarios de esta red social en castellano. Los expertos utilizan la tecnología para recopilar, analizar y clasificar mensajes escritos y orientan los datos obtenidos a la detección de problemas de salud mental o trastornos de la alimentación.


Jaén |
11 de noviembre de 2020

Un equipo de investigación de la Universidad de Jaén ha desarrollado un sistema basado en inteligencia artificial para reconocer las emociones de los usuarios en Twitter. Esta tecnología, aplicada por primera vez al idioma castellano, percibe el estado anímico de las personas que escriben mensajes en la red social, los analiza y clasifica. Los investigadores orientan la información obtenida a áreas como la detección de la depresión, de anorexia y bulimia o el lenguaje abusivo y violento, entre otros ámbitos.

En este trabajo, los investigadores han entrenado el sistema de un ordenador con una serie de tuits ya recopilados e interpretados con anterioridad en el idioma español

Las tecnologías del lenguaje humano son una rama de la inteligencia artificial que se centra en el estudio de sistemas computacionales que son capaces de comprender y generar lenguaje. Este ámbito está relacionado con el aprendizaje automático (machine learning), que es la capacidad de un software o una máquina para identificar y aprender patrones complejos en forma de algoritmos matemáticos de manera autónoma.

Los expertos aplican esta tecnología a un conjunto de datos compuestos por tuits previamente recopilados y analizados por humanos con el fin de detectar emociones en el texto. Además, enseñan a la máquina cómo interpretar nuevos términos en castellano incorporando diccionarios y lexicones al sistema. “Esta tecnología puede aplicarse a ámbitos diversos con la finalidad de detectar problemas de salud mental o violencia verbal.”, explica a la Fundación Descubre Flor Miriam Plaza, co-autora de este estudio e investigadora de la Universidad de Jaén.

En el estudio titulado ’Improved emotion recognition in Spanish social media through incorporation of lexical knowledge’ y publicado en la revista Future Generation Computer Systems, los expertos entrenan el sistema de un ordenador con una serie de tuits ya recopilados e interpretados con anterioridad en el idioma español. De este modo, genera un modelo de lenguaje que le permite reconocer emociones tales como el enfado, el miedo, la alegría y la tristeza. “Es un trabajo complejo porque no se trata de una clasificación binaria de emociones negativas y positivas. Hay muchos matices para detectar la alegría, la tristeza o la sorpresa, por ejemplo”, comenta María Teresa Martín, investigadora de la Universidad de Jaén.

Detección de las emociones

Una vez integrada esta información básica en el sistema, los investigadores incluyeron palabras nuevas de diccionarios y palabras nuevas para ampliar la cantidad de matices que ésta pudiera percibir e incrementar su precisión. Esta enseñanza paulatina de lenguaje, independiente de la base de datos previamente desarrollada, tenía la finalidad de mejorar la efectividad del sistema. Tras detectar el tuit, el sistema lo analiza y le asigna una emoción en base al modelo de lenguaje generado, en este caso, el castellano. Por ejemplo: “Primer disgusto del día. Me acaban de comunicar un robo en el colegio. Se han llevado, al menos, un ordenador. Suma y sigue, por desgracia” el sistema identifica enfado.

Equipo de investigación que ha realizado este trabajo.

Los expertos observaron en este estudio que la emoción más representada en los tuits era la alegría porque era más fácil de detectar para el sistema que el enfado, el miedo o la tristeza, que poseen mayores matices. El investigador de la Universidad de Jaén Luis Alfonso Ureña explica: “No es un proceso perfecto porque esta tecnología no percibe con claridad figuras del lenguaje como la ironía, el sarcasmo o las frases hechas y, además, se generan nuevas expresiones continuamente. Para perfeccionar este sistema, hay que ‘enseñar’ a la máquina continuamente en un idioma concreto, como el castellano de España o el inglés británico”.

En estudios previos, el grupo Sistemas de Acceso Inteligente a la Información puso el foco en la detección de la anorexia y la bulimia y el lenguaje misógino y xenófobo en redes sociales. “Nuestro equipo de investigación se centra en las tecnologías del lenguaje humano aplicado, entre otras áreas, al análisis de sentimientos en español. En el futuro, queremos mejorar la tecnología basada en inteligencia artificial y aprendizaje automático que utilizamos para aplicarla a una mayor variedad de ámbitos”, comenta Luis Alfonso Ureña.

Esta investigación ha sido financiada por los fondos propios del grupo de investigación Sistemas de Acceso Inteligente a la Información, por el Fondo Europeo de Desarrollo Regional (FEDER), el proyecto LIVING-LANG y el proyecto REDES del Gobierno español.

Referencias

Plaza del Arco, F.M; Martín-Valdivia, M.T.; Ureña López, L.A.; Ruslan, M. (2020). ’Improved emotion recognition in Spanish social media through incorporation of lexical knowledge’. Future Generation Computer Systems 99 (2020) 454–464.

Más información:

#CienciaDirecta, agencia de noticias de ciencia andaluza, financiada por la Consejería de Transformación Económica, Industria, Conocimiento y Universidades de la Junta de Andalucía.

Teléfono: 954 232 349

E-mail: comunicacion@fundaciondescubre.es



Share

Últimas publicaciones

Casa Árabe y Fundación Descubre llevan a Madrid la exposición `Paseo Matemático al-Ándalus´
España, Madrid | 07 de noviembre de 2024

Las instalaciones de Casa Árabe han acogido la inauguración de la exposición ‘Paseo Matemático al-Ándalus’ de la Fundación Descubre / Consejería de Universidad, Investigación e Innovación de la Junta de Andalucía. El acto ha contado con la presencia de: Irene Lozano, directora de Casa Árabe, así como la directora general de Fundación Descubre, Teresa Cruz Sánchez, y el director científico del proyecto, Álvaro Martínez Sevilla.

Sigue leyendo
La campaña de anillamiento de aves de Doñana detecta que las migrantes transaharianas llegan con más grasa corporal
Sevilla | 07 de noviembre de 2024

Según el control del paso posnupcial que cada año realiza la ICTS-Doñana en la estación de anillamiento de Manecorro, estas podrían estar parando menos tiempo en la zona.

Sigue leyendo
Un equipo de investigadores del Imibic ofrecen desde Córdoba avances en el tratamiento del ovario poliquístico
Córdoba | 06 de noviembre de 2024

Investigadores del Instituto Maimónides de Investigación Biomédica de Córdoba (IMIBIC) y de la Universidad de Córdoba han participado en este estudio que demuestra una mayor eficacia de fármacos de última generación con respecto a los tratamientos actuales para esta patología. El síndrome de ovario poliquístico (SOP) es el desorden endocrino más frecuente en mujeres en edad reproductiva, afectando a 1 de cada 10.

Sigue leyendo

#CienciaDirecta

Tu fuente de noticias sobre ciencia andaluza

Más información Suscríbete

404 Not Found

404 Not Found


nginx/1.18.0
Ir al contenido