Varios investigadores han tenido una visión amplia del progreso científico en los últimos 50 años y llegan a la misma conclusión preocupante: la productividad científica está disminuyendo. Está tomando más tiempo, más fondos y equipos más grandes para hacer descubrimientos que una vez fueron más rápidos y más baratos. Aunque se han ofrecido una variedad de explicaciones para la desaceleración, una es que, a medida que la investigación se vuelve más compleja y especializada, los científicos deben pasar más tiempo revisando publicaciones, diseñando experimentos sofisticados y analizando datos.
Ahora, el Lab Futurehouse de la investigación de financiación filantrópica está buscando acelerar la investigación científica con una plataforma de IA diseñada para automatizar muchos de los pasos críticos en el camino hacia el progreso científico. La plataforma está compuesta por una serie de agentes de IA especializados para tareas que incluyen recuperación de información, síntesis de información, diseño de síntesis química y análisis de datos.
Los fundadores de Futurehouse Sam Rodriques PhD ’19 y Andrew White creen que al dar acceso a todos los científicos a sus agentes de IA, pueden romper los cuellos de botella más grandes de la ciencia y ayudar a resolver algunos de los problemas más apremiantes de la humanidad.
«El lenguaje natural es el verdadero lenguaje de la ciencia», dice Rodriques. «Otras personas están construyendo modelos básicos para la biología, donde los modelos de aprendizaje automático hablan el lenguaje del ADN o las proteínas, y eso es poderoso. Pero los descubrimientos no están representados en ADN o proteínas. La única forma en que sabemos cómo representar los descubrimientos, la hipótesis y la razón es con el lenguaje natural».
Encontrar grandes problemas
Para su investigación de doctorado en el MIT, Rodriques buscó comprender el funcionamiento interno del cerebro en el laboratorio del profesor Ed Boyden.
«Toda la idea detrás de Futurehouse se inspiró en esta impresión que tuve durante mi doctorado en el MIT de que incluso si tuviéramos toda la información que necesitábamos saber sobre cómo funciona el cerebro, no lo sabríamos porque nadie tiene tiempo para leer toda la literatura», explica Rodriques. «Incluso si pudieran leerlo todo, no podrían armarlo en una teoría integral. Esa fue una pieza fundamental del rompecabezas de Futurehouse».
Rodriques escribió sobre la necesidad de nuevos tipos de grandes colaboraciones de investigación como el último capítulo de su tesis doctoral en 2019, y aunque pasó algún tiempo dirigiendo un laboratorio en el Instituto Francis Crick en Londres después de la graduación, se encontró gravitando hacia amplios problemas en la ciencia que ningún laboratorio solo podía tomar.
«Estaba interesado en cómo automatizar o ampliar la ciencia y qué tipos de nuevas estructuras o tecnologías organizacionales desbloquearían una mayor productividad científica», dice Rodriques.
Cuando Chat-GPT 3.5 se lanzó en noviembre de 2022, Rodriques vio un camino hacia modelos más poderosos que podrían generar ideas científicas por su cuenta. Alrededor de ese tiempo, también conoció a Andrew White, un químico computacional de la Universidad de Rochester a quien se le había otorgado acceso temprano a Chat-GPT 4. White había construido el primer gran agente de idiomas para la ciencia, y los investigadores se unieron a las fuerzas para comenzar Futurehouse.
Los fundadores comenzaron con ganas de crear herramientas de IA distintas para tareas como búsquedas de literatura, análisis de datos y generación de hipótesis. Comenzaron con la recopilación de datos, eventualmente lanzando Paperqa en septiembre de 2024, que Rodriques llama el mejor agente de IA del mundo para recuperar y resumir la información en la literatura científica. Casi al mismo tiempo, lanzaron cualquier persona, una herramienta que permite a los científicos determinar si alguien ha realizado experimentos específicos o explorado hipótesis específicas.
«Estábamos sentados preguntando: ‘¿Cuáles son los tipos de preguntas que nosotros, como científicos, hacemos todo el tiempo?'», Recuerda Rodriques.
Cuando Futurehouse lanzó oficialmente su plataforma el 1 de mayo de este año, renombró algunas de sus herramientas. Paper QA ahora es Crow, y tiene que alguien ahora se llama Owl. Falcon es un agente capaz de compilar y revisar más fuentes que Crow. Otro nuevo agente, Phoenix, puede usar herramientas especializadas para ayudar a los investigadores a planificar experimentos de química. Y Finch es un agente diseñado para automatizar el descubrimiento de datos en biología.
El 20 de mayo, la compañía demostró un flujo de trabajo de descubrimiento científico de múltiples agentes para automatizar los pasos clave del proceso científico e identificar un nuevo candidato terapéutico para la degeneración macular seca relacionada con la edad (DAMD), una causa principal de ceguera irreversible en todo el mundo. En junio, Futurehouse lanzó Ether0, un modelo de razonamiento de peso abierto 24B para la química.
«Realmente tienes que pensar en estos agentes como parte de un sistema más grande», dice Rodriques. «Pronto, los agentes de búsqueda de literatura se integrarán con el agente de análisis de datos, el agente de generación de hipótesis, un agente de planificación de experimentos, y todos serán diseñados para trabajar juntos sin problemas».
Agentes para todos
Hoy cualquiera puede acceder a los agentes de Futurehouse en Platform.futurehouse.org. El lanzamiento de la plataforma de la compañía generó emoción en la industria, y las historias han comenzado a llegar a científicos que usan los agentes para acelerar la investigación.
Uno de los científicos de Futurehouse usó a los agentes para identificar un gen que podría estar asociado con el síndrome de ovario poliquístico y crear una nueva hipótesis de tratamiento para la enfermedad. Otro investigador del Laboratorio Nacional de Lawrence Berkeley usó a Crow para crear un asistente de IA capaz de buscar en la base de datos de investigación de PubMed para obtener información relacionada con la enfermedad de Alzheimer.
Los científicos de otra institución de investigación han utilizado los agentes para realizar revisiones sistemáticas de genes relevantes para la enfermedad de Parkinson, encontrando que los agentes de Futurehouse se desempeñaron mejor que los agentes generales.
Rodriques dice que los científicos que piensan en los agentes menos como Google Scholar y más como un científico asistente inteligente aprovechan al máximo la plataforma.
«Las personas que buscan especulaciones tienden a obtener más kilometraje de la investigación profunda de chat-gpt o3, mientras que las personas que buscan revisiones de literatura realmente fieles tienden a sacar más de nuestros agentes», explica Rodriques.
Rodriques también cree que Futurehouse pronto llegará a un punto en el que sus agentes puedan usar los datos sin procesar de los trabajos de investigación para probar la reproducibilidad de sus resultados y verificar las conclusiones.
A más larga, para mantener el progreso científico avanzando hacia adelante, Rodriques dice que Futurehouse está trabajando en la incrustación de sus agentes con conocimiento tácito para poder realizar análisis más sofisticados, al tiempo que brinda a los agentes la capacidad de usar herramientas computacionales para explorar hipótesis.
«Ha habido tantos avances en torno a los modelos de base para la ciencia y los modelos de idiomas para las proteínas y el ADN, que ahora necesitamos darles a nuestros agentes acceso a esos modelos y todas las otras herramientas que las personas usan comúnmente para hacer ciencia», dice Rodriques. «Construir la infraestructura para permitir que los agentes utilicen herramientas más especializadas para la ciencia serán críticos».