Utilizar la IA para crear proteínas más allá de la naturaleza
Por Mark Miller
El aprendizaje automático y otras herramientas de inteligencia artificial (IA) ya se han utilizado en la investigación de proteínas para predecir las estructuras de proteínas naturales. Ahora, los bioquímicos están utilizando la IA para ir más allá de las plantillas naturales y construir proteínas que nunca antes habían existido. Pero, ¿cómo replica la IA los procesos naturales para ayudar a construir proteínas desde cero, y cuáles son sus posibles aplicaciones?
Un modelo de texto como ChatGPT
Según el artículo "Proteins Never Seen in Nature Are Designed Using AI to Address Biomedical and Industrial Problems Unsolved by Evolution" de Michael Eisenstein en Scientific American, los modelos generativos de IA basados en el lenguaje, como el utilizado por ChatGPT, puede adaptarse para generar nuevas secuencias y estructuras de proteínas. De hecho, una forma eficaz de entender las secuencias de proteínas es pensar en ellas como si fueran texto.
En estas aplicaciones, los algoritmos de IA se entrenan con grandes cantidades de información biológica, pero también deben seguir reglas químicas y biológicas o "gramática" biológica, como la llama Eisenstein. "Para generar una frase o un documento fluido, el algoritmo tiene que aprender las relaciones entre los distintos tipos de palabras, pero también tiene que aprender datos sobre el mundo para crear un documento cohesionado y con sentido", explica en el artículo Ali Madani, fundador de la empresa de diseño de proteínas Profluent. Con esta tecnología de modelado basada en texto, la IA puede ayudar a desarrollar nuevas proteínas de forma similar a como ChatGPT produce texto basado en el lenguaje en el que ha sido entrenado.
Imágenes y paisajes
Aunque el enfoque basado en modelos lingüísticos está demostrando que funciona, no es la única opción. Un programa llamado Chroma emplea modelos de difusión (usados habitualmente en herramientas de IA de generación de imágenes) que son expertos en la manipulación de datos multidimensionales.
Faruck Morcos, PhD, profesor asociado de ciencias biológicas en la Universidad de Texas en Dallas (UT Dallas), utiliza una variante de esta estrategia de imagen. Según una historia publicada por UT Dallas, él y su equipo están generando paisajes tridimensionales que les permiten visualizar nuevas proteínas. "Nuestro nuevo marco es como una hoja de ruta", explica Morcos. "En lugar de limitarnos a analizar las secuencias de proteínas existentes, nos fijamos en la evolución de las proteínas y construimos mapas observando tanto las proteínas que ya existen como generando y trazando secuencias potenciales."
"Para las aplicaciones que nos interesan, como la sostenibilidad, la medicina, la alimentación, la salud y el diseño de materiales, vamos a necesitar ir más allá de lo que ha hecho la naturaleza."
- Markus Buehler, doctor, catedrático McAfee de Ingeniería, Instituto Tecnológico de Massachusetts
La prueba está en el plegado
Uno de los retos clave del diseño y la construcción de nuevas proteínas es la capacidad de validar que funcionarán como proteínas naturales en lugar de ser meras cadenas aleatorias de compuestos químicos.
Un equipo de investigadores de la Universidad de Toronto está probando sus proteínas construidas con IA utilizando OmegaFold, una versión del software AlphaFold 2 de DeepMind. Con este sistema, pudieron confirmar que cualquier secuencia nueva se plegaba en una estructura funcional. Esta validación es fundamental porque el plegamiento traduce una cadena de proteínas en una estructura tridimensional y puede determinar si tiene la forma correcta para funcionar. El equipo confirmó la viabilidad de sus estructuras mediante la creación de versiones físicas de las mismas en el laboratorio.
Poder de las proteínas
Dado que las nuevas proteínas pueden diseñarse para rasgos específicos, resultan tremendamente prometedoras en aplicaciones biomédicas, industriales y medioambientales.
Un informe del Instituto Tecnológico de Massachusetts (MIT) afirma que, aunque las nuevas proteínas pueden resultar problemáticas en aplicaciones biomédicas porque sus propiedades no se conocen del todo, muestran un gran potencial porque pueden modelarse a partir de proteínas naturales ya existentes y adaptarse para satisfacer requisitos específicos.
En el mundo industrial, las nuevas proteínas pueden utilizarse para fabricar materiales con propiedades específicas de rigidez y flexibilidad que sustituyan a los basados en petróleo o cerámica, pero con una huella de carbono mucho menor. Otra posibilidad son los recubrimientos alimentarios, que ayudan a mantener los productos frescos y seguros para el consumo durante más tiempo.
"Para las aplicaciones que nos interesan, como la sostenibilidad, la medicina, la alimentación, la salud y el diseño de materiales, vamos a tener que ir más allá de lo que ha hecho la naturaleza", afirma Markus Buehler, doctor y catedrático McAfee de Ingeniería en el MIT.
Mark Miller es redactor de Thermo Fisher Scientific.