Algoritmos para estudiar el lenguaje ayudan a predecir mutaciones del coronavirus

La lucha constante entre los virus y nuestro sistema inmunitario guarda paralelismos con la forma en que interpretamos las palabras. Investigadores del Instituto Tecnológico de Massachusetts han aplicado herramientas de aprendizaje automático para identificar zonas proteicas que pueden ayudar al coronavirus y otros patógenos a escapar de los anticuerpos y de las vacunas.

Fuente: Agencia SINC

Internacional |

15 de enero de 2021

En 1950 Alan Turing, uno de los padres de la computación, predijo que las máquinas llegarían a competir con los hombres en “campos intelectuales» y planteó que incluso podrían aprender a entender y hablar inglés. Es un objetivo muy ambicioso, porque aunque las reglas gramaticales facilitan la construcción de oraciones, es muy difícil que logren inferir los significados.

Imágenes de proteínas de virus de la gripe, VIH y SARS-CoV-2 con zonas coloreadas según su potencial para mutar y ‘escapar’ de la respuesta inmunitaria. / B. Hie et al.-MIT/Science

En el lenguaje natural humano hay muchas formas de expresar la misma idea y a menudo las palabras usadas en un mismo contexto tienen significados parecidos. Sin embargo, pequeñas variaciones de letras pueden cambiar totalmente el sentido de una frase.

Para enfrentarse a estos retos y entrenar a las computadoras, los científicos han desarrollado herramientas de procesamiento del lenguaje natural basadas en el aprendizaje automático, y ahora, ingenieros del Instituto Tecnológico de Massachusetts (MIT, en EE UU) se han inspirado en ellas para aplicarlas en un campo totalmente diferente: aprender cómo escapan los virus a las defensas de nuestro organismo.

Basándose en cómo utilizamos las palabras, los investigadores presentan esta semana en la revista Science un nuevo método para identificar y predecir mutaciones (variaciones en la secuencia de aminoácidos de las proteínas) que permiten a los virus escapar de la inmunidad humana y las vacunas. De esta forma se podrían evitar o reducir las costosas técnicas experimentales que se usan actualmente con el mismo objetivo.

Consecuencias de cambiar una letra

Uno de los autores, Bryan Bryson, pone a SINC un ejemplo linguístico: “Consideremos la frase en inglés The boy pats the dog (el chico da palmaditas al perro). Con un único cambio en una letra podemos seguir preservando la gramática y la semántica: The boy pets the dog (el chico acaricia al perro), pero también perder la corrección gramatical: The boy patx the dog (patx no existe)”.

“Pero si, cambiando también solo un carácter, queremos que siga el conjunto de reglas del idioma inglés alterando sustancialmente el significado, podemos decir: The boy eats the dog (el chico se come al perro)». Nada que ver con las frases anteriores.

De la misma manera, los autores han descubierto que los virus pueden escapar a la respuesta inmune mediante mutaciones que conservan la ‘gramática o sintaxis’ biológica que gobierna la infectividad viral, pero alterando la ‘semántica’ o significado de una secuencia proteica para que no sea reconocida por los anticuerpos y poder infectar a las células.

Esta capacidad de los virus representa un desafío importante en el desarrollo de vacunas y antivirales, particularmente en la creación de una universal contra la gripe, así como terapias efectivas para el VIH. En la pandemia de covid-19, este ‘escape viral’ también se ha convertido en una preocupación urgente a la hora de buscar soluciones frente al coronavirus.

“Usando datos públicos (secuencias víricas en bruto sin procesar), demostramos que cuando en el modelo optimizamos un cambio semántico alto manteniendo alta la gramática, especialmente para el virus de la gripe, podemos identificar mutaciones ‘enriquecidas’ para ese escape viral”, comenta Bryson.

“Lo que mostramos en el artículo –continúa–, es que podemos localizar regiones o dominios que son más o menos propensas a escapar. Por ejemplo, mostramos que la ‘cabeza’ de la proteína hemaglutinina (HA) del virus de la gripe es más propensa a hacerlo que el ‘tallo’, y esto coincide con lo que los investigadores de la vacuna contra esa enfermedad han visto después de muchos ensayos”.

Predicciones para el coronavirus

Además de en proteínas del virus de la gripe, los resultados del modelo permitieron predecir con precisión mutaciones y regiones asociadas al escape inmune del virus VIH que causa el sida y el coronavirus responsable de la pandemia de covid-19.

“Para la proteína Spike del SARS-CoV-2, nuestro modelo predice que dos dominios de la proteína (el de la unión al receptor y el llamado N-terminal) son más propensos a escapar que otra región de la proteína llamada S2”, explica Bryson, “y podemos utilizar esta información para diseñar experimentos adicionales en el laboratorio y explorar a qué regiones proteicas se unen los anticuerpos terapéuticos o los generados por la vacuna”.

“La importancia de todo esto es que cuando estás diseñando un nuevo antiviral o desarrollando una vacuna, es posible que desees apuntar a zonas que son menos propensas a escapar, ya que esas regiones serán más estables a medida que pase el tiempo”, concluye el investigador del MIT.

Referencia:

Brian Hie, Ellen D. Zhong, Bonnie Berger y Bryan Bryson.»Learning the language of viral evolution and escape». (Perspective: Y.-A. Kim y T.M. Przytycka. «The language of a virus»). Science, 2021

Últimas publicaciones

#CienciaDirecta

Divulgación

`Ciencia al Fresquito´ da la bienvenida al verano en Andalucía con actividades de ciencia

Andalucía | 01 de junio de 2026

Una docena de talleres y observaciones se llevarán a cabo en localidades de las provincias de Cádiz, Sevilla, Huelva, Málaga, Jaén y Granada. El plazo de inscripción en esta iniciativa continúa abierto.

Sigue leyendo

#CienciaDirecta

Ingenierías

Desarrollan un sistema inteligente que reduce hasta un 36 % la dependencia de la red eléctrica en una vivienda

Cádiz | 30 de mayo de 2026

Un equipo de investigación de la Universidad de Cádiz ha desarrollado un sistema de gestión energética en tiempo real que optimiza el uso de placas solares, baterías y calderas en edificios con autoconsumo. La tecnología mejora la eficiencia, reduce la dependencia de la red eléctrica y avanza hacia hogares más autosuficientes.

Sigue leyendo

#CienciaDirecta

Recursos Naturales y Medio Ambiente

Obtienen bacterias de depuradora que eliminan el ibuprofeno de suelos agrícolas en 3 días

Sevilla | 28 de mayo de 2026

Un equipo de investigación del IRNAS-CSIC y la Universidad de Sevilla ha probado en tres suelos agrícolas un grupo de microorganismos procedentes de lodos de depuradora. La estrategia acelera la eliminación de este fármaco, y lo reduce de 12 a 3 días.

Sigue leyendo

#CienciaDirecta

Tu fuente de noticias sobre ciencia andaluza

Más información Suscríbete

¿ERES CIENTÍFICO/A Y QUIERES DIFUNDIR TUS RESULTADOS? CONTÁCTANOS

¿QUIERES CONTACTAR CON UN CIENTÍFICO/A? CONSULTA LA GUÍA EXPERTA

Política de cookies

Este sitio web utiliza cookies para mejorar su experiencia mientras navega por el sitio web. De estas, las cookies que se clasifican como necesarias se almacenan en su navegador, ya que son esenciales para el funcionamiento de las funcionalidades básicas del sitio web. También utilizamos cookies de terceros que nos ayudan a analizar y comprender cómo utiliza este sitio web. Estas cookies se almacenarán en su navegador solo con su consentimiento. También tiene la opción de optar por no recibir estas cookies. Pero la exclusión voluntaria de algunas de estas cookies puede afectar su experiencia de navegación.

Necesarias

Siempre activado

Las cookies necesarias son absolutamente esenciales para que el sitio web funcione correctamente. Esta categoría solo incluye cookies que garantizan funcionalidades básicas y características de seguridad del sitio web. Estas cookies no almacenan ninguna información personal.

Cookie	Duración	Descripción
CONSENT	16 años 7 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. La cookie se utiliza para almacenar el consentimiento del usuario para las cookies.
cookielawinfo-checkbox-advertisement	1 año	La cookie se establece mediante el consentimiento de cookies de GDPR para registrar el consentimiento del usuario para las cookies en la categoría "Publicidad".
cookielawinfo-checkbox-analytics	1 año	Estas cookies están configuradas por el complemento de WordPress de consentimiento de cookies de GDPR. La cookie se utiliza para recordar el consentimiento del usuario para las cookies en la categoría "Análisis".
cookielawinfo-checkbox-necessary	1 año	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "Necesarias".
cookielawinfo-checkbox-performance	1 año	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. La cookie se utiliza para almacenar el consentimiento del usuario para las cookies en la categoría "Rendimiento".
JCS_INENREF	1 hora	La cookie es parte de las medidas de seguridad del sitio web y se utiliza con fines antispam.
JCS_INENTIM	1 hora	La cookie es parte de las medidas de seguridad del sitio web y se utiliza con fines antispam.
PHPSESSID	sessión	Esta cookie es nativa de las aplicaciones PHP. La cookie se utiliza para almacenar e identificar la identificación de sesión única de un usuario con el fin de administrar la sesión del usuario en el sitio web. La cookie es una cookie de sesión y se elimina cuando se cierran todas las ventanas del navegador.

Rendimiento

Las cookies de rendimiento se utilizan para comprender y analizar los índices de rendimiento clave del sitio web, lo que ayuda a brindar una mejor experiencia de usuario a los visitantes.

Cookie	Duración	Descripción
_gat	1 minuto	Google Universal Analytics instala estas cookies para acelerar la tasa de solicitud y limitar la recopilación de datos en sitios de alto tráfico.
YSC	sessión	Estas cookies son establecidas por Youtube y se utilizan para rastrear las vistas de videos incrustados.

Analítica

Las cookies analíticas se utilizan para comprender cómo los visitantes interactúan con el sitio web. Estas cookies ayudan a proporcionar información sobre métricas, el número de visitantes, la tasa de rebote, la fuente de tráfico, etc.

Cookie	Duración	Descripción
_ga	2 años	Esta cookie es instalada por Google Analytics. La cookie se utiliza para calcular los datos de visitantes, sesiones y campañas y realizar un seguimiento del uso del sitio para el informe de análisis del sitio. Las cookies almacenan información de forma anónima y asignan un número generado aleatoriamente para identificar visitantes únicos.
_gid	1 día	Esta cookie es instalada por Google Analytics. La cookie se utiliza para almacenar información sobre cómo los visitantes usan un sitio web y ayuda a crear un informe analítico de cómo está funcionando el sitio web. Los datos recopilados, incluido el número de visitantes, la fuente de donde provienen y las páginas visitadas de forma anónima.

Las cookies publicitarias se utilizan para proporcionar a los visitantes anuncios y campañas de marketing relevantes. Estas cookies rastrean a los visitantes en los sitios web y recopilan información para proporcionar anuncios personalizados.

Cookie	Duración	Descripción
IDE	1 año 24 días	Utilizado por Google DoubleClick y almacena información sobre cómo el usuario utiliza el sitio web y cualquier otro anuncio antes de visitar el sitio web. Se utiliza para presentar a los usuarios anuncios que son relevantes para ellos de acuerdo con el perfil del usuario.
ms-uid	1 año	Estas cookies tienen una finalidad publicitaria. Contienen un valor único generado aleatoriamente que permite a la Plataforma distinguir navegadores y dispositivos. Esta información se utiliza para medir el rendimiento de los anuncios y proporcionar recomendaciones de productos basadas en datos.
NID	6 meses	Esta cookie se utiliza para crear un perfil en función del interés del usuario y mostrar anuncios personalizados a los usuarios.
test_cookie	15 minutos	Esta cookie la establece doubleclick.net. El propósito de la cookie es determinar si el navegador del usuario admite cookies.
VISITOR_INFO1_LIVE	5 meses 27 días	Youtube establece esta cookie. Se utiliza para rastrear la información de los videos de YouTube incrustados en un sitio web.