Algoritmos para estudiar el lenguaje ayudan a predecir mutaciones del coronavirus
La lucha constante entre los virus y nuestro sistema inmunitario guarda paralelismos con la forma en que interpretamos las palabras. Investigadores del Instituto Tecnológico de Massachusetts han aplicado herramientas de aprendizaje automático para identificar zonas proteicas que pueden ayudar al coronavirus y otros patógenos a escapar de los anticuerpos y de las vacunas.
Fuente: Agencia SINC
En 1950 Alan Turing, uno de los padres de la computación, predijo que las máquinas llegarían a competir con los hombres en “campos intelectuales» y planteó que incluso podrían aprender a entender y hablar inglés. Es un objetivo muy ambicioso, porque aunque las reglas gramaticales facilitan la construcción de oraciones, es muy difícil que logren inferir los significados.
En el lenguaje natural humano hay muchas formas de expresar la misma idea y a menudo las palabras usadas en un mismo contexto tienen significados parecidos. Sin embargo, pequeñas variaciones de letras pueden cambiar totalmente el sentido de una frase.
Para enfrentarse a estos retos y entrenar a las computadoras, los científicos han desarrollado herramientas de procesamiento del lenguaje natural basadas en el aprendizaje automático, y ahora, ingenieros del Instituto Tecnológico de Massachusetts (MIT, en EE UU) se han inspirado en ellas para aplicarlas en un campo totalmente diferente: aprender cómo escapan los virus a las defensas de nuestro organismo.
Basándose en cómo utilizamos las palabras, los investigadores presentan esta semana en la revista Science un nuevo método para identificar y predecir mutaciones (variaciones en la secuencia de aminoácidos de las proteínas) que permiten a los virus escapar de la inmunidad humana y las vacunas. De esta forma se podrían evitar o reducir las costosas técnicas experimentales que se usan actualmente con el mismo objetivo.
Consecuencias de cambiar una letra
Uno de los autores, Bryan Bryson, pone a SINC un ejemplo linguístico: “Consideremos la frase en inglés The boy pats the dog (el chico da palmaditas al perro). Con un único cambio en una letra podemos seguir preservando la gramática y la semántica: The boy pets the dog (el chico acaricia al perro), pero también perder la corrección gramatical: The boy patx the dog (patx no existe)”.
“Pero si, cambiando también solo un carácter, queremos que siga el conjunto de reglas del idioma inglés alterando sustancialmente el significado, podemos decir: The boy eats the dog (el chico se come al perro)». Nada que ver con las frases anteriores.
De la misma manera, los autores han descubierto que los virus pueden escapar a la respuesta inmune mediante mutaciones que conservan la ‘gramática o sintaxis’ biológica que gobierna la infectividad viral, pero alterando la ‘semántica’ o significado de una secuencia proteica para que no sea reconocida por los anticuerpos y poder infectar a las células.
Esta capacidad de los virus representa un desafío importante en el desarrollo de vacunas y antivirales, particularmente en la creación de una universal contra la gripe, así como terapias efectivas para el VIH. En la pandemia de covid-19, este ‘escape viral’ también se ha convertido en una preocupación urgente a la hora de buscar soluciones frente al coronavirus.
“Usando datos públicos (secuencias víricas en bruto sin procesar), demostramos que cuando en el modelo optimizamos un cambio semántico alto manteniendo alta la gramática, especialmente para el virus de la gripe, podemos identificar mutaciones ‘enriquecidas’ para ese escape viral”, comenta Bryson.
“Lo que mostramos en el artículo –continúa–, es que podemos localizar regiones o dominios que son más o menos propensas a escapar. Por ejemplo, mostramos que la ‘cabeza’ de la proteína hemaglutinina (HA) del virus de la gripe es más propensa a hacerlo que el ‘tallo’, y esto coincide con lo que los investigadores de la vacuna contra esa enfermedad han visto después de muchos ensayos”.
Predicciones para el coronavirus
Además de en proteínas del virus de la gripe, los resultados del modelo permitieron predecir con precisión mutaciones y regiones asociadas al escape inmune del virus VIH que causa el sida y el coronavirus responsable de la pandemia de covid-19.
“Para la proteína Spike del SARS-CoV-2, nuestro modelo predice que dos dominios de la proteína (el de la unión al receptor y el llamado N-terminal) son más propensos a escapar que otra región de la proteína llamada S2”, explica Bryson, “y podemos utilizar esta información para diseñar experimentos adicionales en el laboratorio y explorar a qué regiones proteicas se unen los anticuerpos terapéuticos o los generados por la vacuna”.
“La importancia de todo esto es que cuando estás diseñando un nuevo antiviral o desarrollando una vacuna, es posible que desees apuntar a zonas que son menos propensas a escapar, ya que esas regiones serán más estables a medida que pase el tiempo”, concluye el investigador del MIT.
Referencia:
Brian Hie, Ellen D. Zhong, Bonnie Berger y Bryan Bryson.»Learning the language of viral evolution and escape». (Perspective: Y.-A. Kim y T.M. Przytycka. «The language of a virus»). Science, 2021
Últimas publicaciones
Un grupo de investigación de la Universidad de Cádiz ha empleado un sistema de extracción ‘verde’ para identificar la cantidad de este aminoácido esencial, necesario para producir proteínas, así como la hormona melatonina y el neurotransmisor serotonina en el organismo. Tras los ensayos, realizados con hongos comestibles del sur de Andalucía y el norte de Marruecos, los resultados evidencian su alta concentración en este tipo de alimentos y abre nuevas vías de estudio para determinar su potencial terapéutico.
Sigue leyendoUn equipo de investigación de la Universidad de Málaga ha evaluado a casi un centenar de estudiantes de entre 8 y 12 años para entender mejor los desafíos léxicos a los que se enfrentan aquellos con pérdida auditiva. Las expertas sugieren un enfoque basado en relaciones entre determinadas clases de palabras para mejorar su aprendizaje y que puedan estudiar en igualdad de condiciones que sus compañeros oyentes.
Nos encontramos a menos de un día del solsticio de diciembre, que tendrá lugar a las 10:20 de este sábado, hora española. Esta efeméride marca el comienzo de las estación astronómicas de invierno para el hemisferio norte. Dejamos atrás el otoño, con sus tonalidades amarillas, naranjas y marrones, y damos paso al color blanco de los copos de nieve, a las luces de colores, y a las flores de pascua. Son algunos de los protagonistas de estas fiestas, que también tienen su ciencia. Por ello os proponemos descubrir diferentes curiosidades científicas relacionadas con la Navidad. ¿Sabías que el espumillón comenzó a fabricarse de aluminio y plomo y con el paso del tiempo ha variado su composición para hacerse ahora de PVC? ¿Te has preguntado alguna vez por qué las típicas flores de esta época del año son esas y no otras? ¿ O cuánto consumen las luces led del árbol que adornas cada año?
Sigue leyendo