El proceso de diseño computacional en ingeniería mecánica a menudo comienza con un problema o una meta, seguido de una evaluación de la literatura, los recursos y los sistemas disponibles para abordar el problema. En cambio, el Laboratorio de Computación de Diseño e Ingeniería Digital (DeCoDE) del MIT explora los límites de lo que es posible.
Trabajando con el MIT-IBM Watson AI Lab, el líder del grupo, el profesor asistente de desarrollo profesional de ABS, Faez Ahmed, y el estudiante graduado Amin Heyrani Nobari en el Departamento de Ingeniería Mecánica están combinando técnicas de aprendizaje automático e IA generativa, modelado físico y principios de ingeniería para abordar desafíos de diseño y mejorar la creación de sistemas mecánicos. Uno de sus proyectos, Vínculosinvestiga formas en que se pueden conectar barras y juntas planas para trazar trayectorias curvas. Aquí, Ahmed y Nobari describen su trabajo reciente.
P: ¿Cómo considera su equipo abordar las cuestiones de ingeniería mecánica desde el punto de vista de las observaciones?
ahmed: La pregunta en la que hemos estado pensando es: ¿Cómo se puede utilizar la IA generativa en aplicaciones de ingeniería? Un desafío clave es incorporar precisión en los modelos de IA generativa. Ahora, en el trabajo específico que hemos estado explorando allí, estamos utilizando esta idea de enfoques de aprendizaje contrastivo autosupervisados, donde efectivamente estamos aprendiendo estos vínculos y representaciones curvas del diseño, o cómo se ve el diseño y cómo funciona. .
Esto está muy relacionado con la idea del descubrimiento automatizado: ¿podemos realmente descubrir nuevos productos con algoritmos de IA? Otro comentario sobre el panorama más amplio: una de las ideas clave, específicamente con los vínculos, pero en términos generales en torno a la IA generativa y los grandes modelos de lenguaje: todos estos son la misma familia de modelos que estamos analizando, y la precisión realmente juega un papel importante en todos. Entonces, los aprendizajes que tenemos de este tipo de modelos, donde usted tiene, en alguna forma de aprendizaje basado en datos, asistido por simuladores de ingeniería e incorporaciones conjuntas de diseño y rendimiento, también pueden traducirse potencialmente a otros dominios de ingeniería. Lo que estamos mostrando es una prueba de concepto. Luego la gente puede tomarlo y diseñar barcos y aviones, y problemas precisos de generación de imágenes, etc.
En el caso de los vínculos, su diseño parece un conjunto de barras y cómo están conectadas. Cómo funciona es básicamente el camino que transcribirían a medida que se mueven, y aprendemos estas representaciones conjuntas. Entonces, ahí está tu entrada principal (alguien vendrá y dibujará algún camino) y estás tratando de generar un mecanismo que pueda rastrearlo. Eso nos permite resolver el problema de una manera mucho más precisa y significativamente más rápida, con 28 veces menos error (más preciso) y 20 veces más rápido que los enfoques de última generación anteriores.
P: Cuénteme sobre el método de vínculos y cómo se compara con otros métodos similares.
Nobari: El aprendizaje contrastivo ocurre entre los mecanismos, que se representan como gráficos, por lo que básicamente cada articulación será un nodo en un gráfico y el nodo incluirá algunas características. Las características son la posición, el espacio y el tipo de juntas, pueden ser juntas fijas o juntas libres.
Tenemos una arquitectura que tiene en cuenta algunas de las cosas básicas subyacentes cuando se trata de la descripción de la cinemática de un mecanismo, pero es esencialmente una red neuronal de gráficos que calcula incorporaciones para estos gráficos de mecanismos. Luego, tenemos otro modelo que toma como entrada estas curvas y crea una integración para eso, y conectamos estas dos modalidades diferentes usando aprendizaje contrastivo.
Luego, este marco de aprendizaje contrastivo que entrenamos se utiliza para encontrar nuevos mecanismos, pero obviamente también nos preocupamos por la precisión. Además de cualquier mecanismo candidato que se identifique, también tenemos un paso de optimización adicional, donde estos mecanismos identificados se optimizarán aún más para acercarse lo más posible a esas curvas objetivo.
Si tienes la parte combinatoria correcta y estás bastante cerca de donde necesitas estar para llegar a la curva objetivo que tienes, puedes hacer la optimización directa basada en gradiente y ajustar la posición de las uniones para obtener rendimiento súper preciso en él. Ese es un aspecto muy importante para que funcione.
Estos son ejemplos de las letras del alfabeto, pero son muy difíciles de lograr tradicionalmente con los métodos existentes. Otros métodos basados en el aprendizaje automático a menudo ni siquiera son capaces de hacer este tipo de cosas porque solo están entrenados en cuatro o seis barras, que son mecanismos muy pequeños. Pero lo que hemos podido demostrar es que incluso con un número relativamente pequeño de articulaciones, es posible acercarse mucho a esas curvas.
Antes de esto, no sabíamos cuáles eran los límites de las capacidades de diseño con un único mecanismo de vinculación. Es una pregunta muy difícil de saber. ¿Realmente puedes escribir la letra M, verdad? Nadie ha hecho eso nunca, y el mecanismo es tan complejo y tan raro que consiste en encontrar una aguja en el pajar. Pero con este método demostramos que es posible.
Hemos estudiado el uso de modelos generativos disponibles para gráficos. Generalmente, los modelos generativos para gráficos son muy difíciles de entrenar y generalmente no son muy efectivos, especialmente cuando se trata de mezclar variables continuas que tienen una sensibilidad muy alta a cuál será la cinemática real de un mecanismo. Al mismo tiempo, existen todas estas formas diferentes de combinar uniones y vínculos. Estos modelos simplemente no pueden generar de manera efectiva.
Creo que la complejidad del problema es más obvia cuando se observa cómo la gente lo aborda con optimización. Con la optimización, esto se convierte en un problema no lineal de enteros mixtos. Usando algunas optimizaciones simples de dos niveles o incluso simplificando el problema, básicamente crean aproximaciones de todas las funciones, de modo que puedan usar programación cónica entera mixta para abordar el problema. El espacio combinatorio combinado con el espacio continuo es tan grande que básicamente pueden llegar hasta siete uniones. Más allá de eso, se vuelve extremadamente difícil y se necesitan dos días para crear un mecanismo para un objetivo específico. Si hiciera esto de manera exhaustiva, sería muy difícil cubrir todo el espacio de diseño. Aquí es donde no puedes simplemente lanzarle aprendizaje profundo sin tratar de ser un poco más inteligente acerca de cómo hacerlo.
Los enfoques de última generación basados en el aprendizaje profundo utilizan el aprendizaje por refuerzo. Ellos, dada una curva objetivo, comienzan a construir estos mecanismos de forma más o menos aleatoria, básicamente un enfoque de optimización de Monte Carlo. La medida para esto es comparar directamente la curva que traza un mecanismo y las curvas objetivo que se ingresan al modelo, y mostramos que nuestro modelo funciona 28 veces mejor que eso. Nuestro enfoque dura 75 segundos y el enfoque basado en el aprendizaje por refuerzo tarda 45 minutos. El enfoque de optimización lo ejecuta durante más de 24 horas y no converge.
Creo que hemos llegado al punto en el que tenemos una prueba de concepto muy sólida con los mecanismos de vinculación. Es un problema lo suficientemente complicado como para que podamos ver que la optimización convencional y el aprendizaje profundo convencional por sí solos no son suficientes.
P: ¿Cuál es el panorama general detrás de la necesidad de desarrollar técnicas como vínculos que permitan el futuro del codiseño humano-IA?
ahmed: El más obvio es el diseño de máquinas y sistemas mecánicos, que es lo que ya hemos mostrado. Dicho esto, creo que una contribución clave de este trabajo es que es un espacio discreto y continuo en el que estamos aprendiendo. Entonces, si piensas en los vínculos que existen y en cómo se conectan entre sí, ese es un espacio discreto. O estás conectado o no: 0 y 1, pero el lugar donde está cada nodo es un espacio continuo que puede variar; puedes estar en cualquier parte del espacio. Aprender para estos espacios discretos y continuos es un problema extremadamente desafiante. La mayor parte del aprendizaje automático que vemos, como en la visión por computadora, es continuo o el lenguaje es mayoritariamente discreto. Al mostrar este sistema discreto y continuo, creo que la idea clave se generaliza a muchas aplicaciones de ingeniería, desde metamateriales hasta redes complejas, otros tipos de estructuras, etc.
Hay pasos en los que estamos pensando de inmediato, y una pregunta natural gira en torno a sistemas mecánicos más complejos y más física, como por ejemplo, comenzar a agregar diferentes formas de comportamiento elástico. Luego, también puedes pensar en diferentes tipos de componentes. También estamos pensando en cómo se puede incorporar la precisión en modelos de lenguaje grandes, y algunos de los aprendizajes se transferirán allí. Estamos pensando en hacer que estos modelos sean generativos. En este momento, en cierto sentido, están recuperando mecanismos y luego optimizándolos a partir de un conjunto de datos, mientras que los modelos generativos generarán estos métodos. También estamos explorando ese aprendizaje de un extremo a otro, donde la optimización no es necesaria.
Nobari: Hay algunos lugares en la ingeniería mecánica donde se usan, y hay aplicaciones muy comunes de sistemas para este tipo de síntesis cinemática inversa, donde esto sería útil. Algunos de los que me vienen a la mente son, por ejemplo, los sistemas de suspensión de automóviles, donde desea una trayectoria de movimiento específica para su mecanismo de suspensión general. Por lo general, lo modelan en 2D con modelos de planificación del mecanismo de suspensión general.
Creo que el siguiente paso, y lo que finalmente será muy útil, es demostrar el mismo marco o uno similar para otros problemas complicados que involucran valores combinatorios y continuos.
Estos problemas incluyen una de las cosas que he estado investigando: mecanismos compatibles. Por ejemplo, cuando tienes la mecánica de vínculos rígidos continuos, en lugar de estos discretos, tendrías una distribución de materiales y movimiento, y una parte del material deforma el resto del material para darte un tipo diferente de movimiento.
Con mecanismos compatibles, se usan en muchos lugares diferentes, a veces en máquinas de precisión para mecanismos de fijación, donde se desea que una pieza específica se mantenga en su lugar, usando un mecanismo que la fija, que puede hacerlo de manera consistente y con muy alta precisión. Si pudieras automatizar mucho de eso con este tipo de marco, sería muy útil.
Todos estos son problemas difíciles que involucran tanto variables de diseño combinatorio como variables de diseño continuo. Creo que estamos muy cerca de eso y, en última instancia, esa será la etapa final.
Este trabajo fue apoyado, en parte, por el MIT-IBM Watson AI Lab.