Los científicos del MIT han lanzado un potente modelo de IA de código abierto, llamado Boltz-1, que podría acelerar significativamente la investigación biomédica y el desarrollo de fármacos.
Desarrollado por un equipo de investigadores de la Clínica Jameel del MIT para el Aprendizaje Automático en Salud, Boltz-1 es el primer modelo de código abierto que alcanza un rendimiento de última generación al nivel de AlphaFold3, el modelo de Google DeepMind que predice las estructuras 3D de proteínas y otras moléculas biológicas.
Los estudiantes graduados del MIT Jeremy Wohlwend y Gabriele Corso fueron los principales desarrolladores de Boltz-1, junto con el afiliado de investigación de MIT Jameel Clinic Saro Passaro y los profesores de ingeniería eléctrica e informática del MIT Regina Barzilay y Tommi Jaakkola. Wohlwend y Corso presentaron el modelo en un evento el 5 de diciembre en el Stata Center del MIT, donde dijeron que su objetivo final es fomentar la colaboración global, acelerar los descubrimientos y proporcionar una plataforma sólida para avanzar en el modelado biomolecular.
«Esperamos que este sea un punto de partida para la comunidad», dijo Corso. “Hay una razón por la que lo llamamos Boltz-1 y no Boltz. Este no es el final del camino. Queremos tanta contribución de la comunidad como podamos obtener”.
Las proteínas desempeñan un papel esencial en casi todos los procesos biológicos. La forma de una proteína está estrechamente relacionada con su función, por lo que comprender la estructura de una proteína es fundamental para diseñar nuevos fármacos o diseñar nuevas proteínas con funcionalidades específicas. Pero debido al proceso extremadamente complejo mediante el cual la larga cadena de aminoácidos de una proteína se pliega en una estructura tridimensional, predecir con precisión esa estructura ha sido un gran desafío durante décadas.
AlphaFold2 de DeepMind, que le valió a Demis Hassabis y John Jumper el Premio Nobel de Química 2024, utiliza el aprendizaje automático para predecir rápidamente estructuras de proteínas en 3D que son tan precisas que son indistinguibles de las derivadas experimentalmente por los científicos. Este modelo de código abierto ha sido utilizado por equipos de investigación académicos y comerciales de todo el mundo, lo que ha impulsado muchos avances en el desarrollo de fármacos.
AlphaFold3 mejora a sus predecesores al incorporar un modelo de IA generativo, conocido como modelo de difusión, que puede manejar mejor la cantidad de incertidumbre involucrada en la predicción de estructuras proteicas extremadamente complejas. Sin embargo, a diferencia de AlphaFold2, AlphaFold3 no es completamente de código abierto ni está disponible para uso comercial, lo que provocó críticas de la comunidad científica y dio inicio a una carrera global para construir una versión comercial del modelo.
Para su trabajo en Boltz-1, los investigadores del MIT siguieron el mismo enfoque inicial que AlphaFold3, pero después de estudiar el modelo de difusión subyacente, exploraron posibles mejoras. Incorporaron aquellos que aumentaron más la precisión del modelo, como nuevos algoritmos que mejoran la eficiencia de la predicción.
Junto con el modelo en sí, abrieron todo su proceso para entrenamiento y ajuste para que otros científicos puedan desarrollar Boltz-1.
“Estoy inmensamente orgulloso de Jeremy, Gabriele, Saro y el resto del equipo de Jameel Clinic por hacer posible esta liberación. Este proyecto requirió muchos días y noches de trabajo, con una determinación inquebrantable para llegar a este punto. Hay muchas ideas interesantes para futuras mejoras y esperamos compartirlas en los próximos meses”, afirma Barzilay.
Al equipo del MIT le llevó cuatro meses de trabajo y muchos experimentos desarrollar Boltz-1. Uno de sus mayores desafíos fue superar la ambigüedad y heterogeneidad contenida en el Banco de Datos de Proteínas, una colección de todas las estructuras biomoleculares que miles de biólogos han resuelto en los últimos 70 años.
“Pasé muchas noches largas luchando con estos datos. Gran parte es conocimiento puro del dominio que uno simplemente tiene que adquirir. No hay atajos”, afirma Wohlwend.
Al final, sus experimentos muestran que Boltz-1 alcanza el mismo nivel de precisión que AlphaFold3 en un conjunto diverso de predicciones de estructuras biomoleculares complejas.
“Lo que Jeremy, Gabriele y Saro han logrado es nada menos que extraordinario. Su arduo trabajo y perseverancia en este proyecto han hecho que la predicción de estructuras biomoleculares sea más accesible para la comunidad en general y revolucionará los avances en las ciencias moleculares”, afirma Jaakkola.
Los investigadores planean seguir mejorando el rendimiento de Boltz-1 y reducir la cantidad de tiempo que lleva hacer predicciones. También invitan a los investigadores a probar Boltz-1 en su repositorio de GitHub y conectarse con otros usuarios de Boltz-1 en su canal Slack.
“Creemos que todavía quedan muchos, muchos años de trabajo para mejorar estos modelos. Estamos muy ansiosos por colaborar con otros y ver qué hace la comunidad con esta herramienta”, añade Wohlwend.
Mathai Mammen, director ejecutivo y presidente de Parabilis Medicines, califica a Boltz-1 como un modelo «revolucionario». «Al abrir el código fuente de este avance, la Clínica Jameel del MIT y sus colaboradores están democratizando el acceso a herramientas de biología estructural de vanguardia», afirma. “Este esfuerzo histórico acelerará la creación de medicamentos que cambian vidas. ¡Gracias al equipo de Boltz-1 por impulsar este profundo salto adelante!
«Boltz-1 será enormemente útil para mi laboratorio y para toda la comunidad», añade Jonathan Weissman, profesor de biología del MIT y miembro del Instituto Whitehead de Ingeniería Biomédica que no participó en el estudio. «Veremos toda una ola de descubrimientos posibles gracias a la democratización de esta poderosa herramienta». Weissman añade que anticipa que la naturaleza de código abierto de Boltz-1 conducirá a una amplia gama de nuevas aplicaciones creativas.
Este trabajo también fue apoyado por una subvención de Expediciones de la Fundación Nacional de Ciencias de EE. UU.; la Clínica Jameel; el programa de Descubrimiento de Contramedidas Médicas Contra Amenazas Nuevas y Emergentes (DOMANE) de la Agencia de Reducción de Amenazas de Defensa de los Estados Unidos; y el proyecto MATCHMAKERS apoyado por la asociación Cancer Grand Challenges financiada por Cancer Research UK y el Instituto Nacional del Cáncer de EE. UU.