Cuando el agua se congela, pasa de una fase líquida a una fase sólida, lo que resulta en un cambio drástico en propiedades como la densidad y el volumen. Las transiciones de fase en el agua son tan comunes que la mayoría de nosotros probablemente ni siquiera pensamos en ellas, pero las transiciones de fase en materiales novedosos o sistemas físicos complejos son un área de estudio importante.
Para comprender completamente estos sistemas, los científicos deben poder reconocer fases y detectar las transiciones entre ellas. Pero a menudo no está claro cómo cuantificar los cambios de fase en un sistema desconocido, especialmente cuando los datos son escasos.
Investigadores del MIT y la Universidad de Basilea en Suiza aplicaron modelos de inteligencia artificial generativa a este problema, desarrollando un nuevo marco de aprendizaje automático que puede trazar automáticamente diagramas de fase para sistemas físicos novedosos.
Su enfoque de aprendizaje automático basado en la física es más eficiente que las laboriosas técnicas manuales que se basan en conocimientos teóricos. Es importante destacar que, debido a que su enfoque aprovecha los modelos generativos, no requiere enormes conjuntos de datos de entrenamiento etiquetados que se utilizan en otras técnicas de aprendizaje automático.
Un marco de este tipo podría ayudar a los científicos a investigar las propiedades termodinámicas de nuevos materiales o detectar entrelazamientos en sistemas cuánticos, por ejemplo. En última instancia, esta técnica podría permitir a los científicos descubrir de forma autónoma fases desconocidas de la materia.
“Si tienes un sistema nuevo con propiedades totalmente desconocidas, ¿cómo elegirías qué cantidad observable estudiar? La esperanza, al menos con las herramientas basadas en datos, es que se puedan escanear sistemas nuevos y grandes de forma automatizada y esto le indicará cambios importantes en el sistema. Esto podría ser una herramienta en el proceso de descubrimiento científico automatizado de propiedades nuevas y exóticas de las fases”, afirma Frank Schäfer, postdoctorado en el Laboratorio Julia del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) y coautor de un artículo sobre Este enfoque.
Junto a Schäfer en el artículo se encuentran el primer autor Julian Arnold, estudiante de posgrado de la Universidad de Basilea; Alan Edelman, profesor de matemáticas aplicadas del Departamento de Matemáticas y líder del Julia Lab; y el autor principal Christoph Bruder, profesor del Departamento de Física de la Universidad de Basilea. La investigación se publica hoy en Cartas de revisión física.
Detección de transiciones de fase mediante IA
Si bien la transición del agua a hielo podría estar entre los ejemplos más obvios de cambio de fase, cambios de fase más exóticos, como cuando un material pasa de ser un conductor normal a un superconductor, son de gran interés para los científicos.
Estas transiciones pueden detectarse identificando un “parámetro de orden”, una cantidad que es importante y que se espera que cambie. Por ejemplo, el agua se congela y pasa a una fase sólida (hielo) cuando su temperatura cae por debajo de los 0 grados centígrados. En este caso, un parámetro de orden apropiado podría definirse en términos de la proporción de moléculas de agua que forman parte de la red cristalina versus aquellas que permanecen en un estado desordenado.
En el pasado, los investigadores confiaban en la experiencia en física para construir diagramas de fases manualmente, aprovechando la comprensión teórica para saber qué parámetros de orden son importantes. Esto no sólo es tedioso para sistemas complejos, y quizás imposible para sistemas desconocidos con nuevos comportamientos, sino que también introduce un sesgo humano en la solución.
Más recientemente, los investigadores han comenzado a utilizar el aprendizaje automático para construir clasificadores discriminativos que puedan resolver esta tarea aprendiendo a clasificar una estadística de medición como proveniente de una fase particular del sistema físico, de la misma manera que tales modelos clasifican una imagen como un gato o un perro.
Los investigadores del MIT demostraron cómo se pueden utilizar modelos generativos para resolver esta tarea de clasificación de manera mucho más eficiente y basada en la física.
El lenguaje de programación Julia, un lenguaje popular para la informática científica que también se utiliza en las clases introductorias de álgebra lineal del MIT, ofrece muchas herramientas que lo hacen invaluable para construir tales modelos generativos, agrega Schäfer.
Los modelos generativos, como los que subyacen a ChatGPT y Dall-E, normalmente funcionan estimando la distribución de probabilidad de algunos datos, que utilizan para generar nuevos puntos de datos que se ajustan a la distribución (como nuevas imágenes de gatos que son similares a imágenes de gatos existentes). .
Sin embargo, cuando se dispone de simulaciones de un sistema físico utilizando técnicas científicas probadas y verdaderas, los investigadores obtienen un modelo de su distribución de probabilidad de forma gratuita. Esta distribución describe las estadísticas de medición del sistema físico.
Un modelo más informado
La idea del equipo del MIT es que esta distribución de probabilidad también define un modelo generativo sobre el cual se puede construir un clasificador. Conectan el modelo generativo a fórmulas estadísticas estándar para construir directamente un clasificador en lugar de aprenderlo de muestras, como se hizo con los enfoques discriminativos.
“Esta es una forma realmente agradable de incorporar algo que sabes sobre tu sistema físico en lo más profundo de tu esquema de aprendizaje automático. Va mucho más allá de simplemente realizar ingeniería de características en sus muestras de datos o simples sesgos inductivos”, afirma Schäfer.
Este clasificador generativo puede determinar en qué fase se encuentra el sistema dado algún parámetro, como temperatura o presión. Y debido a que los investigadores aproximan directamente las distribuciones de probabilidad subyacentes a las mediciones del sistema físico, el clasificador tiene conocimiento del sistema.
Esto permite que su método funcione mejor que otras técnicas de aprendizaje automático. Y como puede funcionar automáticamente sin necesidad de una formación exhaustiva, su enfoque mejora significativamente la eficiencia computacional a la hora de identificar transiciones de fase.
Al final del día, de manera similar a cómo se le podría pedir a ChatGPT que resuelva un problema matemático, los investigadores pueden hacerle al clasificador generativo preguntas como «¿esta muestra pertenece a la fase I o a la fase II?» o «¿esta muestra se generó a alta o baja temperatura?»
Los científicos también podrían utilizar este enfoque para resolver diferentes tareas de clasificación binaria en sistemas físicos, posiblemente para detectar entrelazamientos en sistemas cuánticos (¿el estado está entrelazado o no?) o determinar si la teoría A o B es la más adecuada para resolver un problema particular. También podrían utilizar este enfoque para comprender y mejorar modelos de lenguaje grandes como ChatGPT, identificando cómo se deben ajustar ciertos parámetros para que el chatbot brinde los mejores resultados.
En el futuro, los investigadores también quieren estudiar garantías teóricas sobre cuántas mediciones necesitarían para detectar eficazmente las transiciones de fase y estimar la cantidad de cálculo que requeriría.
Este trabajo fue financiado, en parte, por la Fundación Nacional Suiza para la Ciencia, el Fondo Semilla Lockheed Martin del MIT-Suiza y las Iniciativas Internacionales de Ciencia y Tecnología del MIT.