VOLVER

Share

Crean un acelerador de modelos de inteligencia artificial hasta un 70% más rápido con menos datos

Un equipo de investigación de la Universidad de Cádiz ha creado REDIBAGG, un método que acelera el entrenamiento de modelos de inteligencia artificial hasta un 70%, al utilizar menos datos pero sin perder precisión. La técnica tiene potencial para analizar grandes volúmenes de información en campos tan diversos como la medicina, la industria o las finanzas.

Fuente: Fundación Descubre


Cádiz |
05 de julio de 2025

Un equipo de investigación del departamento de Ingeniería Informática de la Universidad de Cádiz ha desarrollado REDIBAGG, un método que permite acelerar el entrenamiento de modelos de inteligencia artificial manteniendo su precisión. Esta técnica reduce el tamaño de los datos empleados durante la fase de aprendizaje, lo que rebaja en hasta un 70 % el tiempo de procesamiento y, por tanto, reduce el consumo de recursos informáticos.

La herramienta está diseñada para trabajar con grandes volúmenes de información que se utilicen para tareas de clasificación, es decir, situaciones en las que los algoritmos deben elegir entre varias opciones concretas. Así, por ejemplo, en salud podría acelerar sistemas de diagnóstico automático sin sacrificar fiabilidad, en industria serviría para detectar fallos en tiempo real con menor consumo de recursos, o en finanzas procesar grandes registros en menos tiempo para prevenir fraudes o analizar riesgos.

Supercomputador y servidores de la Universidad de Cádiz.

Como explican en el artículo ‘REDIBAGG: Reducing the training set size in ensemble machine learning-based prediction models’, publicado en la revista Engineering Applications of Artificial Intelligence, el sistema se comporta bien en contextos dispares. “No es un método orientado a ciertos tipos de datos, sino que es muy versátil y robusto ante cualquier volumen con gran número de características o instancias”, apunta a la Fundación Descubre Juan-Francisco Cabrera-Sánchez, coautor del estudio.

Otra ventaja de la herramienta es su simplicidad de implementación. Se puede aplicar fácilmente en entornos de trabajo habituales con inteligencia artificial como el lenguaje de programación Python, y bibliotecas estándar como Scikit-learn, específica para usar técnicas de aprendizaje automático de forma sencilla, lo que facilitaría su adopción por parte de investigadores, empresas o instituciones.

¿Cómo funciona?

REDIBAGG es una variante de bagging (abreviatura en inglés de bootstrap aggregating), un método de combinación de modelos muy utilizado para mejorar la precisión de los clasificadores en el contexto de la inteligencia artificial. La herramienta crea múltiples subconjuntos a partir de la muestra original de los datos. Cada submuestra se usa para el aprendizaje de un clasificador base, y luego se combinan las predicciones para tomar decisiones más fiables. El método de remuestreo que utiliza bagging es bootstrap, una técnica estadística que genera submuestras aleatorias con reemplazo. Es decir, se crean nuevas colecciones de datos eligiendo ejemplos al azar del conjunto original, permitiendo que algunos se repitan y otros no.

Aunque bagging es eficaz, su principal inconveniente es el alto coste computacional. Cada modelo se entrena con una submuestra del mismo tamaño que el conjunto original, lo que ralentiza el aprendizaje y multiplica el consumo de recursos. Frente a esta limitación, los expertos han aplicado un nuevo sistema de remuestreo que genera subconjuntos más pequeños, pero representativos.

Para validar su eficacia lo pusieron a prueba en 30 conjuntos de datos reales utilizando Urania, el supercomputador de la UCA. 

A partir de esas submuestras, han entrenado varios modelos independientes, combinando sus predicciones igual que en bagging clásico. “En la era de big data, donde se trabaja con grandes volúmenes de datos, utilizar métodos que reduzcan los tiempos de aprendizaje es de agradecer, sobre todo si se rebaja hasta un 70 % con respecto al método original”, destaca Esther-Lydia Silva-Ramírez, autora principal del estudio.

Para validar su eficacia lo pusieron a prueba en 30 conjuntos de datos reales utilizando Urania, el supercomputador de la Universidad de Cádiz. Trabajaron en áreas tan diversas como la medicina, la biología, la física o las ciencias sociales. Además, se aplicó con distintos tipos de algoritmos de clasificación, como árboles de decisión, redes neuronales, máquinas de soporte vectorial o modelos bayesianos.

Próximos objetivos 

En todos los casos, el nuevo enfoque demostró una precisión comparable al método original. De media, consiguieron rebajar el tiempo de entrenamiento en un 35 %, alcanzando reducciones del 70 % en conjuntos de datos muy grandes. “Al trabajar con modelos menos complejos se reducen las horas de entrenamiento y el coste de almacenamiento, por lo que el método es mucho más eficiente”, matiza la científica.

Los investigadores se proponen liberar el método para su disposición por parte de la comunidad científica.

Ahora los investigadores se proponen liberar el método para su disposición por parte de la comunidad científica. También contemplan estudiar cómo la herramienta podría aplicarse a otros sistemas de aprendizaje automático, aparte de bagging y sus variantes, combinarlo con técnicas de selección de variables para obtener modelos aún más eficientes, o explorar su adaptación a tareas de regresión, en las que se predicen valores numéricos en lugar de categorías.

El trabajo ha sido financiado mediante el proyecto Generación Inteligente de Software Sostenible (GENIUS) de la Consejería de Universidad, Investigación e Innovación de la Junta de Andalucía y Fondos FEDER, así como el Proyecto iSUN del Ministerio de Ciencia, Innovación y Universidades.

Reportaje: REDIBAGG, el método andaluz que reduce el esfuerzo de las máquinas para aprender

Referencias

Esther-Lydia Silva-Ramírez, Juan-Francisco Cabrera-Sánchez, Manuel López-Coello ‘REDIBAGG: Reducing the training set size in ensemble machine learning-based prediction models’, Engineering Applications of Artificial Intelligence. 2025

Más información:

#CienciaDirecta, agencia de noticias de ciencia andaluza, impulsada por la Consejería de Universidad, Investigación e Innovación de la Junta de Andalucía, con la colaboración de la Fundación Española para la Ciencia y la Tecnología-Ministerio de Ciencia, Innovación y Universidades.

Teléfono: 663 920 093

E-mail: comunicacion@fundaciondescubre.es



Share

Últimas publicaciones

Desarrollan un sistema ‘inteligente’ que analiza los genes implicados en enfermedades como la fatiga crónica
Málaga | 25 de julio de 2025

Un equipo de investigación de la Universidad de Málaga ha desarrollado una herramienta que aplica simultáneamente hasta 26 técnicas de inteligencia artificial para explorar interacciones genéticas. Esta plataforma permite tanto a profesionales sanitarios como a investigadores identificar estas relaciones y establecer posibles orígenes de patologías como la fibromialgia o la encefalomielitis miálgica, facilitando así su estudio y una mejor toma de decisiones clínicas.

Sigue leyendo
Demuestran la eficacia de la cirugía ganglionar conservadora en pacientes con melanoma metastásico
Sevilla | 25 de julio de 2025

Una investigación, liderada por el Servicio de Dermatología del Hospital Virgen Macarena y publicada en la revista ‘The Oncologist’, demuestra que esta técnica obtiene los mismos resultados oncológicos que la cirugía radical y evita complicaciones. El estudio, realizado en colaboración con tres hospitales españoles, evidencia que más del 80% de pacientes con melanoma y metástasis en ganglios linfáticos puede beneficiarse de cirugía conservadora.

Sigue leyendo
Crean una boya inteligente para monitorizar la calidad microbiológica del agua en las playas
Cádiz, Granada, Sevilla | 25 de julio de 2025

Las empresas Sensactive Technology (Granada), Tecysa (Cádiz) e Innovia (Madrid) desarrollan un proyecto de I+D+i con financiación de CTA (Corporación Tecnológica de Andalucía), en colaboración con el grupo de Ingenería Electrónica de la Universidad de Sevilla y el hospital San Cecilio de Granada. En concreto, esta boya es capaz de monitorizar en tiempo real la calidad microbiológica y fisicoquímica del agua en zonas de baño, lo que permite un sistema de alerta temprana ante contaminaciones, facilita la toma de decisiones y mejora la protección medioambiental y de salud pública de los bañistas.

Sigue leyendo

#CienciaDirecta

Tu fuente de noticias sobre ciencia andaluza

Más información Suscríbete

Ir al contenido