A medida que han ido creciendo las capacidades de los modelos de IA generativa, probablemente haya visto cómo pueden transformar mensajes de texto simples en imágenes hiperrealistas e incluso clips de vídeo extendidos.
Más recientemente, la IA generativa ha demostrado potencial para ayudar a químicos y biólogos a explorar moléculas estáticas, como proteínas y ADN. Modelos como AlphaFold pueden predecir estructuras moleculares para acelerar el descubrimiento de fármacos, y la “RFdiffusion”, asistida por el MIT, por ejemplo, puede ayudar a diseñar nuevas proteínas. Sin embargo, un desafío es que las moléculas se mueven y se agitan constantemente, lo cual es importante modelar al construir nuevas proteínas y fármacos. Simular estos movimientos en una computadora usando la física (una técnica conocida como dinámica molecular) puede ser muy costoso y requiere miles de millones de pasos de tiempo en supercomputadoras.
Como un paso hacia la simulación de estos comportamientos de manera más eficiente, el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL) y los investigadores del Departamento de Matemáticas han desarrollado un modelo generativo que aprende de datos anteriores. El sistema del equipo, llamado MDGen, puede tomar un cuadro de una molécula 3D y simular lo que sucederá a continuación como un video, conectar imágenes fijas separadas e incluso completar cuadros faltantes. Al presionar el “botón de reproducción” de las moléculas, la herramienta podría ayudar a los químicos a diseñar nuevas moléculas y estudiar de cerca qué tan bien interactuarían sus prototipos de medicamentos para el cáncer y otras enfermedades con la estructura molecular que pretende impactar.
El coautor principal Bowen Jing SM ’22 dice que MDGen es una prueba temprana de concepto, pero sugiere el comienzo de una nueva e interesante dirección de investigación. «Al principio, los modelos de IA generativa producían vídeos algo simples, como una persona parpadeando o un perro moviendo la cola», dice Jing, estudiante de doctorado en CSAIL. “Avanzando unos años, ahora tenemos modelos increíbles como Sora o Veo que pueden ser útiles en todo tipo de formas interesantes. Esperamos inculcar una visión similar para el mundo molecular, donde las trayectorias dinámicas son los videos. Por ejemplo, puedes darle al modelo el primer y el décimo cuadro, y animará lo que hay en el medio, o puede eliminar el ruido de un video molecular y adivinar lo que estaba oculto”.
Los investigadores dicen que MDGen representa un cambio de paradigma con respecto a trabajos anteriores comparables con IA generativa de una manera que permite casos de uso mucho más amplios. Los enfoques anteriores eran «autorregresivos», lo que significa que se basaban en el fotograma fijo anterior para construir el siguiente, comenzando desde el primer fotograma para crear una secuencia de vídeo. Por el contrario, MDGen genera los fotogramas en paralelo con la difusión. Esto significa que MDGen se puede utilizar para, por ejemplo, conectar fotogramas en los puntos finales, o «muestrear» una trayectoria de baja velocidad de fotogramas además de presionar reproducir en el fotograma inicial.
Este trabajo se presentó en un artículo mostrado en la Conferencia sobre Sistemas de Procesamiento de Información Neural (NeurIPS) el pasado mes de diciembre. El verano pasado, fue premiado por su potencial impacto comercial en el Taller ML4LMS de la Conferencia Internacional sobre Aprendizaje Automático.
Algunos pequeños pasos adelante para la dinámica molecular
En experimentos, Jing y sus colegas descubrieron que las simulaciones de MDGen eran similares a ejecutar simulaciones físicas directamente, al tiempo que producían trayectorias de 10 a 100 veces más rápidas.
El equipo probó primero la capacidad de su modelo para captar un marco 3D de una molécula y generar los siguientes 100 nanosegundos. Su sistema reunió sucesivos bloques de 10 nanosegundos para que estas generaciones alcanzaran esa duración. El equipo descubrió que MDGen podía competir con la precisión de un modelo de referencia, mientras completaba el proceso de generación de video en aproximadamente un minuto, una mera fracción de las tres horas que le tomó al modelo de referencia simular la misma dinámica.
Cuando se le dio el primer y último fotograma de una secuencia de un nanosegundo, MDGen también modeló los pasos intermedios. El sistema de los investigadores demostró cierto grado de realismo en más de 100.000 predicciones diferentes: simuló trayectorias moleculares más probables que sus líneas de base en clips de menos de 100 nanosegundos. En estas pruebas, MDGen también indicó una capacidad de generalizar sobre péptidos que no había visto antes.
Las capacidades de MDGen también incluyen la simulación de cuadros dentro de cuadros, «aumentando el muestreo» de los pasos entre cada nanosegundo para capturar fenómenos moleculares más rápidos de manera más adecuada. Incluso puede “pintar” estructuras de moléculas, restaurando información sobre ellas que se eliminó. Con el tiempo, los investigadores podrían utilizar estas características para diseñar proteínas basándose en una especificación de cómo deben moverse las diferentes partes de la molécula.
Jugando con la dinámica de las proteínas
Jing y el coautor principal Hannes Stärk dicen que MDGen es una señal temprana de progreso hacia la generación de dinámica molecular de manera más eficiente. Aún así, carecen de datos para que estos modelos tengan un impacto inmediato en el diseño de fármacos o moléculas que induzcan los movimientos que los químicos querrán ver en una estructura objetivo.
Los investigadores pretenden escalar MDGen desde el modelado de moléculas hasta la predicción de cómo cambiarán las proteínas con el tiempo. “Actualmente utilizamos sistemas de juguetes”, afirma Stärk, también estudiante de doctorado en CSAIL. “Para mejorar las capacidades predictivas de MDGen para modelar proteínas, necesitaremos aprovechar la arquitectura actual y los datos disponibles. Todavía no tenemos un repositorio a escala de YouTube para ese tipo de simulaciones, por lo que esperamos desarrollar un método de aprendizaje automático independiente que pueda acelerar el proceso de recopilación de datos para nuestro modelo”.
Por ahora, MDGen presenta un camino alentador hacia el modelado de cambios moleculares invisibles a simple vista. Los químicos también podrían utilizar estas simulaciones para profundizar en el comportamiento de prototipos de medicamentos para enfermedades como el cáncer o la tuberculosis.
«Los métodos de aprendizaje automático que aprenden de la simulación física representan una nueva y floreciente frontera en la IA para la ciencia», dice Bonnie Berger, profesora de Matemáticas Simons del MIT, investigadora principal de CSAIL y autora principal del artículo. «MDGen es un marco de modelado versátil y multipropósito que conecta estos dos dominios, y estamos muy entusiasmados de compartir nuestros primeros modelos en esta dirección».
«Muestrear rutas de transición realistas entre estados moleculares es un desafío importante», dice el autor principal Tommi Jaakkola, profesor de ingeniería eléctrica e informática Thomas Siebel del MIT y del Instituto de Datos, Sistemas y Sociedad, e investigador principal de CSAIL. . «Este trabajo inicial muestra cómo podríamos comenzar a abordar estos desafíos cambiando el modelado generativo a ejecuciones de simulación completa».
Investigadores del campo de la bioinformática han anunciado este sistema por su capacidad para simular transformaciones moleculares. «MDGen modela simulaciones de dinámica molecular como una distribución conjunta de incrustaciones estructurales, capturando movimientos moleculares entre pasos de tiempo discretos», dice el profesor asociado de la Universidad Tecnológica de Chalmers, Simon Olsson, que no participó en la investigación. «Aprovechando un objetivo de aprendizaje enmascarado, MDGen permite casos de uso innovadores, como el muestreo de rutas de transición, estableciendo analogías con trayectorias de pintura que conectan fases metaestables».
El trabajo de los investigadores sobre MDGen fue apoyado, en parte, por el Instituto Nacional de Ciencias Médicas Generales, el Departamento de Energía de EE. UU., la Fundación Nacional de Ciencias, el Consorcio de Aprendizaje Automático para el Descubrimiento y Síntesis Farmacéuticos, la Clínica Abdul Latif Jameel para el Aprendizaje Automático en Salud, la Agencia de Reducción de Amenazas de Defensa y la Agencia de Proyectos de Investigación Avanzada de Defensa.