Elaborar una hipótesis de investigación única y prometedora es una habilidad fundamental para cualquier científico. También puede llevar mucho tiempo: los nuevos candidatos a doctorado pueden pasar el primer año de su programa tratando de decidir exactamente qué explorar en sus experimentos. ¿Y si la inteligencia artificial pudiera ayudar?
Los investigadores del MIT han creado una forma de generar y evaluar de forma autónoma hipótesis de investigación prometedoras en todos los campos, a través de la colaboración entre humanos y IA. En un nuevo artículo, describen cómo utilizaron este marco para crear hipótesis basadas en evidencia que se alinean con las necesidades de investigación no satisfechas en el campo de los materiales de inspiración biológica.
Publicado el miércoles en Materiales avanzadosel estudio fue coautor de Alireza Ghafarollahi, postdoctorado en el Laboratorio de Mecánica Atomística y Molecular (LAMM), y Markus Buehler, profesor Jerry McAfee de Ingeniería en los departamentos de Ingeniería Civil y Ambiental y de Ingeniería Mecánica del MIT y director de LAMM.
El marco, que los investigadores llaman SciAgents, consta de múltiples agentes de IA, cada uno con capacidades específicas y acceso a datos, que aprovechan métodos de «razonamiento gráfico», donde los modelos de IA utilizan un gráfico de conocimiento que organiza y define las relaciones entre diversos conceptos científicos. El enfoque de múltiples agentes imita la forma en que los sistemas biológicos se organizan como grupos de bloques de construcción elementales. Buehler señala que este principio de “divide y vencerás” es un paradigma destacado en biología en muchos niveles, desde los materiales hasta los enjambres de insectos y las civilizaciones, todos ellos ejemplos en los que la inteligencia total es mucho mayor que la suma de las capacidades de los individuos.
«Al utilizar múltiples agentes de IA, intentamos simular el proceso mediante el cual las comunidades de científicos hacen descubrimientos», dice Buehler. “En el MIT, lo logramos al tener un grupo de personas con diferentes orígenes trabajando juntas y encontrándose en cafeterías o en el Corredor Infinito del MIT. Pero eso es muy coincidente y lento. Nuestra misión es simular el proceso de descubrimiento explorando si los sistemas de IA pueden ser creativos y hacer descubrimientos”.
Automatizando buenas ideas
Como lo han demostrado los desarrollos recientes, los grandes modelos de lenguaje (LLM) han demostrado una capacidad impresionante para responder preguntas, resumir información y ejecutar tareas simples. Pero son bastante limitados a la hora de generar nuevas ideas desde cero. Los investigadores del MIT querían diseñar un sistema que permitiera a los modelos de IA realizar un proceso de varios pasos más sofisticado que vaya más allá de recordar información aprendida durante el entrenamiento, para extrapolar y crear nuevos conocimientos.
La base de su enfoque es un gráfico de conocimiento ontológico, que organiza y establece conexiones entre diversos conceptos científicos. Para hacer los gráficos, los investigadores introducen un conjunto de artículos científicos en un modelo de IA generativa. En trabajos anteriores, Buehler utilizó un campo de las matemáticas conocido como teoría de categorías para ayudar al modelo de IA a desarrollar abstracciones de conceptos científicos como gráficos, basadas en la definición de relaciones entre componentes, de una manera que podría ser analizada por otros modelos a través de un proceso llamado razonamiento de gráficos. . Esto centra los modelos de IA en el desarrollo de una forma más basada en principios de comprender los conceptos; también les permite generalizar mejor entre dominios.
«Esto es realmente importante para nosotros a la hora de crear modelos de IA centrados en la ciencia, ya que las teorías científicas suelen estar arraigadas en principios generalizables y no simplemente en la recuperación de conocimientos», afirma Buehler. «Al centrar los modelos de IA en el ‘pensamiento’ de tal manera, podemos ir más allá de los métodos convencionales y explorar usos más creativos de la IA».
Para el artículo más reciente, los investigadores utilizaron alrededor de 1.000 estudios científicos sobre materiales biológicos, pero Buehler dice que los gráficos de conocimiento podrían generarse utilizando muchos más o menos artículos de investigación de cualquier campo.
Una vez establecido el gráfico, los investigadores desarrollaron un sistema de inteligencia artificial para descubrimientos científicos, con múltiples modelos especializados para desempeñar funciones específicas en el sistema. La mayoría de los componentes se construyeron a partir de los modelos de la serie ChatGPT-4 de OpenAI y utilizaron una técnica conocida como aprendizaje en contexto, en la que las indicaciones proporcionan información contextual sobre el papel del modelo en el sistema y al mismo tiempo le permiten aprender de los datos proporcionados.
Los agentes individuales en el marco interactúan entre sí para resolver colectivamente un problema complejo que ninguno de ellos podría resolver por sí solo. La primera tarea que se les asigna es generar la hipótesis de investigación. Las interacciones de LLM comienzan después de que se ha definido un subgrafo a partir del gráfico de conocimiento, lo que puede ocurrir de forma aleatoria o ingresando manualmente un par de palabras clave analizadas en los artículos.
En el marco, un modelo de lenguaje que los investigadores llamaron «ontólogo» tiene la tarea de definir términos científicos en los artículos y examinar las conexiones entre ellos, dando cuerpo al gráfico de conocimiento. Luego, un modelo llamado «Científico 1» elabora una propuesta de investigación basada en factores como su capacidad para descubrir propiedades inesperadas y novedosas. La propuesta incluye una discusión de los posibles hallazgos, el impacto de la investigación y una conjetura sobre los mecanismos de acción subyacentes. Un modelo “Scientist 2” amplía la idea, sugiriendo enfoques experimentales y de simulación específicos y realizando otras mejoras. Finalmente, un modelo “crítico” destaca sus fortalezas y debilidades y sugiere mejoras adicionales.
«Se trata de formar un equipo de expertos que no piensen todos de la misma manera», dice Buehler. “Tienen que pensar diferente y tener capacidades diferentes. El agente crítico está programado deliberadamente para criticar a los demás, por lo que no todos están de acuerdo y dicen que es una gran idea. Tienes un agente que dice: ‘Aquí hay una debilidad, ¿puedes explicarla mejor?’ Eso hace que el resultado sea muy diferente al de los modelos individuales”.
Otros agentes del sistema pueden buscar literatura existente, lo que proporciona al sistema una forma no sólo de evaluar la viabilidad sino también de crear y evaluar la novedad de cada idea.
Fortalecer el sistema
Para validar su enfoque, Buehler y Ghafarollahi construyeron un gráfico de conocimiento basado en las palabras «seda» y «intensivo en energía». Utilizando este marco, el modelo “Científico 1” propuso integrar seda con pigmentos a base de diente de león para crear biomateriales con propiedades ópticas y mecánicas mejoradas. El modelo predijo que el material sería significativamente más fuerte que los materiales de seda tradicionales y requeriría menos energía para procesarse.
Luego, el Científico 2 hizo sugerencias, como el uso de herramientas específicas de simulación de dinámica molecular para explorar cómo interactuarían los materiales propuestos, y agregó que una buena aplicación para el material sería un adhesivo bioinspirado. Luego, el modelo Critic destacó varias fortalezas del material propuesto y áreas de mejora, como su escalabilidad, estabilidad a largo plazo y los impactos ambientales del uso de solventes. Para abordar esas preocupaciones, el crítico sugirió realizar estudios piloto para la validación del proceso y realizar análisis rigurosos de la durabilidad del material.
Los investigadores también llevaron a cabo otros experimentos con palabras clave elegidas al azar, que produjeron varias hipótesis originales sobre chips de microfluidos biomiméticos más eficientes, mejorando las propiedades mecánicas de los andamios a base de colágeno y la interacción entre el grafeno y las fibrillas de amiloide para crear dispositivos bioelectrónicos.
«El sistema pudo generar estas ideas nuevas y rigurosas basadas en el camino desde el gráfico de conocimiento», dice Ghafarollahi. “En términos de novedad y aplicabilidad, los materiales parecían robustos y novedosos. En trabajos futuros, generaremos miles, o decenas de miles, de nuevas ideas de investigación, y luego podremos categorizarlas, tratar de comprender mejor cómo se generan estos materiales y cómo podrían mejorarse aún más”.
En el futuro, los investigadores esperan incorporar nuevas herramientas para recuperar información y ejecutar simulaciones en sus marcos. También pueden cambiar fácilmente los modelos básicos en sus marcos por modelos más avanzados, lo que permite que el sistema se adapte a las últimas innovaciones en IA.
«Debido a la forma en que interactúan estos agentes, una mejora en un modelo, incluso si es leve, tiene un impacto enorme en los comportamientos generales y el resultado del sistema», dice Buehler.
Desde que publicaron una preimpresión con detalles de código abierto de su enfoque, los investigadores han sido contactados por cientos de personas interesadas en utilizar los marcos en diversos campos científicos e incluso áreas como finanzas y ciberseguridad.
«Hay muchas cosas que puedes hacer sin tener que ir al laboratorio», dice Buehler. “Básicamente, lo que se desea es ir al laboratorio al final del proceso. El laboratorio es caro y lleva mucho tiempo, por lo que se necesita un sistema que pueda profundizar en las mejores ideas, formular las mejores hipótesis y predecir con precisión los comportamientos emergentes. Nuestra visión es hacer que esto sea fácil de usar, de modo que pueda usar una aplicación para aportar otras ideas o arrastrar conjuntos de datos para desafiar realmente el modelo y realizar nuevos descubrimientos”.