La inteligencia artificial ayuda a descifrar la función de proteínas desconocidas
El nuevo trabajo de investigadores del CSIC permite la aplicación masiva de estos métodos de IA de aprendizaje profundo para entender estas moléculas en organismos menos estudiados, identificar nuevas funciones de genes y explorar qué proteínas pueden ser de interés biomédico y biotecnológico con mayor precisión. El estudio, publicado en la revista Nuc Acids Red Genomics and Bioinformatics, sienta las bases del uso de la IA en otras aplicaciones.
Fuente: Agencia SINC
Investigadores del Centro Andaluz de Biología del Desarrollo (CABD) y del Instituto de Biología Evolutiva de Barcelona (IBE) han puesto en marcha nuevas técnicas avanzadas de inteligencia artificial para el análisis de proteínas.
El equipo ha conseguido demostrar que se puede identificar y describir lo que hacen las proteínas en detalle, incluso sin información previa. Este trabajo permite la aplicación masiva de estos métodos para entender las proteínas en organismos menos estudiados, identificar nuevas funciones de genes y explorar qué proteínas pueden ser de interés biomédico y biotecnológico con mayor precisión que los métodos tradicionales.
En la naturaleza la información contenida en el ADN se transforma en proteínas, que son las que actúan en las células. En este proyecto, liderado por los investigadores del CABD, Ildefonso Cases y Ana M. Rojas junto a Rosa Fernández, del IBE, se han empleado dos métodos basados en el aprendizaje profundo (deep learning) para analizar proteínas en varios organismos modelo, como la levadura, el ratón o la mosca de la fruta.
La exploración mostró que los modelos de lenguaje (Transformers) son más efectivos que las redes convolucionales, proporcionando información más precisa e informativa sobre las proteínas de las especies estudiadas. Además, los modelos de lenguaje pueden recuperar información funcional a partir de datos de ARN (molécula que lleva las instrucciones del ADN para fabricar proteínas en las células).
“Estamos en un momento crítico debido a la enorme cantidad de proyectos de secuenciación de organismos desconocidos que producen millones de secuencias, de las que no podemos predecir su función usando métodos tradicionales”, explica Rojas. Este trabajo abre nuevas vías de investigación relacionadas con una mayor precisión en los modelos de análisis y clasificación de funciones de las proteínas.
Este nuevo estudio, publicado en la revista Nuc Acids Red Genomics and Bioinformatics, sienta las bases del uso de la IA en otras aplicaciones.
Biología computacional
“Estas herramientas de aprendizaje profundo permitirán abordar nuevos problemas en biología computacional. Estamos trabajando en la aplicación de estas técnicas para otros objetivos, como promotores a la carta, anotación de grupos de células en single-cell, o ingeniería de proteínas”, dice la investigadora del IBE
Por su parte, Rosa Fernández, hace hincapié en que esta investigación es fundamental en el campo de la biodiversidad, donde cada día se publican nuevas secuencias de proteínas cuya función es desconocida, lo cual permite abordar el problema de anotación del proteoma oscuro (Dark Proteome).
“Para ello estamos usando estas herramientas en miles de transcriptomas del reino animal, trabajo que se encuentra en revisión. Cuanta más información tengamos de las funciones de secuencias nuevas, más rápido descifraremos los mecanismos moleculares de procesos biológicos que se dan en el ámbito de la biodiversidad y regeneración con potenciales aplicaciones biotecnológicas (industria alimentaria) y biomédicas (industria farmacéutica)”, concluye la investigadora.
Referencia:
Israel Barrios-Núñez et al. ‘Decoding functional proteome information in model organisms using protein language models’, Nuc Acids Red Genomics and Bioinformatics (2024).
Últimas publicaciones
Nos encontramos a menos de un día del solsticio de diciembre, que tendrá lugar a las 10:20 de este sábado, hora española. Esta efeméride marca el comienzo de las estación astronómicas de invierno para el hemisferio norte. Dejamos atrás el otoño, con sus tonalidades amarillas, naranjas y marrones, y damos paso al color blanco de los copos de nieve, a las luces de colores, y a las flores de pascua. Son algunos de los protagonistas de estas fiestas, que también tienen su ciencia. Por ello os proponemos descubrir diferentes curiosidades científicas relacionadas con la Navidad. ¿Sabías que el espumillón comenzó a fabricarse de aluminio y plomo y con el paso del tiempo ha variado su composición para hacerse ahora de PVC? ¿Te has preguntado alguna vez por qué las típicas flores de esta época del año son esas y no otras? ¿ O cuánto consumen las luces led del árbol que adornas cada año?
Sigue leyendoEl consejero de Universidad, Investigación e Innovación, José Carlos Gómez Villamandos, ha presidido el Patronato celebrado en Sevilla. El Plan prevé el fomento además de la divulgación en el ámbito de la emergencia, la seguridad y la defensa, al tiempo que comenzarán los trabajos para la divulgación del trío de eclipses solares previstos en la Península para 2026, 2027 y 2028. La Fundación ha celebrado previamente el acto de reconocimiento de las personas y entidades Colaboradoras Extraordinarias de Descubre.
Durante doce días, y con la financiación de la Embajada de España en Mauritania, Álvaro Martínez Sevilla, director científico del proyecto Paseos Matemáticos, en colaboración con el profesor del Departamento de Lenguaje y Sistemas Informáticos de la Universidad de Granada Sergio Alonso, han recorrido las principales localidades que forman esta ruta para recabar información que les permita realizar un estudio matemático geométrico de la arquitectura y decoración local. Con todo el material recopilado, elaborarán la nueva exposición ‘Paseos Matemáticos Al Ándalus y la ruta de las caravanas’ que se inaugurará en 2025 en la capital mauritana y recorrerá también varias ciudades andaluzas.
Sigue leyendo