VOLVER

Share

Desarrollan un método que mejora la evaluación de la calidad en la predicción de los sistemas de diagnóstico médico

Investigadores de la Universidad Pablo de Olavide han propuesto un método innovador para la evaluación de sistemas de diagnóstico, denominado curva IMCP, que muestra el rendimiento de la clasificación y, por otro lado, identifica para qué valores de la variable objetivo el modelo está ofreciendo mejor o peor calidad en la predicción. 

Fuente: Universidad Pablo de Olavide


Sevilla |
08 de julio de 2024

En el campo de la biomedicina, la evaluación de la calidad de los sistemas de diagnóstico es fundamental para garantizar que se aplican soluciones adecuadas. En los modelos predictivos tiene especial relevancia el hecho de que los valores objeto de estudio son de distinta clase (multiclase) y estas clases a su vez presentan una gran variedad en su frecuencia. Es lo que se conoce como desbalanceo o desequilibrio de datos.

En contextos médicos es de suma importancia disponer de un método capaz de mostrar la calidad del sistema en cuanto a las predicciones que realiza. Hasta ahora, para evaluar de forma gráfica la calidad de un sistema de diagnóstico solo existía la curva ROC (Receiver Operating Characteristic), un análisis utilizado para medir el coste/beneficio de decisiones diagnósticas, pero que no funciona con conjuntos de datos multiclase como, por ejemplo, distintos tipos de tumores.

El investigador de la Universidad Pablo de Olavide Jesús Aguilar.

Investigadores del grupo Data Analytics Science & Engineering, liderado por Jesús Aguilar, catedrático de Lenguajes y Sistemas Informáticos de la Universidad Pablo de Olavide, en colaboración con Marcin Michalak, investigador de la Silesian University of Technology (Polonia), han propuesto un método innovador para la evaluación de sistemas de diagnóstico, denominado curva IMCP, que muestra el rendimiento de la clasificación y, por otro lado, identifica para qué valores de la variable objetivo el modelo está ofreciendo mejor o peor calidad en la predicción.

La curva IMPC (Imbalanced Multiclass Classification Performance) ha sido evaluada en la predicción de 35 tipos de tumores a partir de una colección de 6.756 muestras de tumores metastásicos y primarios obtenidos por la Hartwig Medical Foundation (Países Bajos) y el Pan-Cancer Analysis of Whole Genomes Consortium, analizando un total de 511 características. Como resultado, se revela que un modelo predictivo para tumores aparentemente fiable (92,4% de exactitud en la predicción), podría mostrar un comportamiento desigual para diferentes tipos de tumores (bueno en la predicción de melanoma, pero malo en el caso de sarcoma), lo que necesariamente debería conducir a un examen humano más detallado en el caso de ciertos tipos de tumores, en consonancia con la fiabilidad del sistema de diagnóstico para esos casos.

Descripción de la metodología usada para la curva IMCP.

El análisis propuesto por Aguilar y Michalak permite evaluar el rendimiento para cada valor por separado. De este modo, revela en qué casos el rendimiento global oculta distintos resultados para diferentes tipos de valores (multiclase). Así, si el rendimiento global es del 92,4%, podría darse el caso en que el sistema diagnostique el melanoma con una exactitud del 98,6%, pero el sarcoma con 17,5%. Por tanto, la curva IMCP posibilita identificar la fiabilidad de la predicción a partir de conjuntos de datos de distinta clase.

El método, basado en el cálculo de distancias de funciones de distribución de probabilidad, es aplicable en contextos en donde la curva ROC no puede usarse, cubriendo un vacío existente en la actualidad en el campo de machine learning, con utilidad en multitud de disciplinas.

La curva IMCP puede visualizarse con facilidad a partir de las probabilidades de asignación a cada valor de la variable objetivo proporcionadas por el sistema de diagnóstico, mediante el uso de una librería implementada en Python, de acceso libre y código abierto, publicada en https://github.com/adaa-polsl/imcp. El trabajo ha sido publicado por la editorial Springer-Nature.

Referencia:

Aguilar-Ruiz, J.S., Michalak, M. ‘Classification performance assessment for imbalanced multiclass data’. Scientific Reports 14, 10759 (2024).


Share

Últimas publicaciones

El stand de la Fundación Descubre acogerá cuatro proyectos de Ciencia Ciudadana en la 23ª Feria de la Ciencia de Sevilla
Sevilla | 16 de abril de 2025

Los investigadores responsables realizarán actividades previas a la I Jornada de Ciencia Ciudadana que se celebrará el próximo 28 de abril en el Pabellón de la Unión Europea de La Cartuja. Estas iniciativas forman parte del proyecto ‘Andalucía + ciencia ciudadana’, impulsado por la Consejería de Universidad, Investigación e Innovación y coordinado por Fundación Descubre y la Universidad Pablo de Olavide, que pretende potenciar la utilización de esta metodología entre distintos agentes de la región.

Sigue leyendo
Generan hidrógeno verde a partir de residuos de vino y lodos de depuradora tratados con ozono
Cádiz | 15 de abril de 2025

Un equipo de investigación de la Universidad de Cádiz ha demostrado cómo el tratamiento con este gas mejora notablemente la producción de biohidrógeno y otros compuestos con valor industrial. La innovación tecnológica de este estudio facilita el aprovechamiento energético de residuos orgánicos de proximidad, contribuyendo a la economía circular y reduciendo los costes ambientales asociados a su gestión.

Sigue leyendo
La UMA desarrolla un tratamiento para mejorar la limpieza y la seguridad urbana en Semana Santa
Málaga | 14 de abril de 2025

La universidad malagueña colabora con la ciudad en una solución que aporta seguridad creando una película antideslizante protectora que no modifica el aspecto natural de la roca. En total, está previsto emplear 5.000 litros del nuevo líquido anticera y 2.500 litros del protector antideslizante, cuya efectividad ha sido verificada en condiciones reales.

Sigue leyendo

#CienciaDirecta

Tu fuente de noticias sobre ciencia andaluza

Más información Suscríbete

404 Not Found

404 Not Found


nginx/1.18.0
Ir al contenido