Los modelos de difusión como Dall-E de OpenAI se están volviendo cada vez más útiles para ayudar a hacer una lluvia de ideas sobre nuevos diseños. Los humanos pueden incitar a estos sistemas a generar una imagen, crear un video o refinar un plan, y regresar con ideas que no habían considerado antes.
¿Pero sabía que los modelos generativos de inteligencia artificial (Genai) también están avanzando en la creación de robots que funcionan? Los enfoques recientes basados en difusión han generado estructuras y los sistemas que las controlan desde cero. Con o sin la entrada de un usuario, estos modelos pueden hacer nuevos diseños y luego evaluarlos en simulación antes de fabricar.
Un nuevo enfoque del Laboratorio de Informática e Inteligencia Artificial (CSAIL) del MIT aplica este conocimiento generativo para mejorar los diseños robóticos de los humanos. Los usuarios pueden redactar un modelo 3D de un robot y especificar qué piezas les gustaría ver modificar un modelo de difusión, proporcionando sus dimensiones de antemano. Genai luego hace una lluvia de ideas sobre la forma óptima para estas áreas y prueba sus ideas en la simulación. Cuando el sistema encuentra el diseño correcto, puede guardar y luego fabricar un robot en el mundo real en funcionamiento con una impresora 3D, sin requerir ajustes adicionales.
Los investigadores utilizaron este enfoque para crear un robot que aumente un promedio de aproximadamente 2 pies, o un 41 por ciento más alto que una máquina similar que crearon por su cuenta. Las máquinas tienen una apariencia casi idéntica: ambas están hechas de un tipo de plástico llamado ácido poliláctico, y aunque inicialmente parecen planas, surgen en forma de diamante cuando un motor tira del cordón unido a ellos. Entonces, ¿qué hizo exactamente la IA de manera diferente?
Una apariencia más cercana revela que los enlaces generados por IA son curvos y se parecen a las gruesas baquetas (los bateristas de instrumentos musicales usan), mientras que las piezas de conexión del robot estándar son rectas y rectangulares.
Mejores y mejores manchas
Los investigadores comenzaron a refinar su robot de salto muestreando 500 diseños potenciales utilizando un vector de incrustación inicial, una representación numérica que captura características de alto nivel para guiar los diseños generados por el modelo AI. A partir de estos, seleccionaron las 12 opciones principales basadas en el rendimiento en la simulación y las usaron para optimizar el vector de incrustación.
Este proceso se repitió cinco veces, guiando progresivamente el modelo AI para generar mejores diseños. El diseño resultante se parecía a una blob, por lo que los investigadores llevaron a su sistema a escalar el borrador para que se ajuste a su modelo 3D. Luego fabricaron la forma, descubriendo que de hecho mejoró las habilidades de salto del robot.
La ventaja de usar modelos de difusión para esta tarea, según el autor co-líder y el postdoc de CSAIL Byungchul Kim, es que pueden encontrar soluciones no convencionales para refinar los robots.
«Queríamos hacer que nuestra máquina saltara más alta, por lo que pensamos que podríamos hacer que los enlaces conecten sus partes lo más delgados posible para hacerlas ligeras», dice Kim. «Sin embargo, una estructura tan delgada puede romperse fácilmente si solo usamos material impreso en 3D. A nuestro modelo de difusión se le ocurrió una mejor idea al sugerir una forma única que permitió al robot almacenar más energía antes de que saltara, sin hacer que los enlaces sean demasiado finos. Esta creatividad nos ayudó a aprender sobre la física subyacente de la máquina».
Luego, el equipo encargó a su sistema de redactar un pie optimizado para asegurarse de que aterrizara de manera segura. Repitieron el proceso de optimización, eventualmente eligiendo el diseño mejor de rendimiento para adjuntar a la parte inferior de su máquina. Kim y sus colegas descubrieron que su máquina diseñada por IA cayó con mucha menos frecuencia que su línea de base, con una mejora del 84 por ciento.
La capacidad del modelo de difusión para actualizar las habilidades de salto y aterrizaje de un robot sugiere que podría ser útil para mejorar cómo se diseñan otras máquinas. Por ejemplo, una empresa que trabaja en la fabricación o en los robots domésticos podría utilizar un enfoque similar para mejorar sus prototipos, ahorrando a los ingenieros tiempo normalmente reservado para iterar en esos cambios.
El equilibrio detrás del rebote
Para crear un robot que pudiera saltar alto y aterrizar de manera estable, los investigadores reconocieron que necesitaban lograr un equilibrio entre ambos objetivos. Representaron tanto la altura de salto como la tasa de éxito del aterrizaje como datos numéricos, y luego entrenaron su sistema para encontrar un punto dulce entre ambos vectores de incrustación que podrían ayudar a construir una estructura 3D óptima.
Los investigadores señalan que, si bien este robot asistido por IA superó a su contraparte diseñada por humanos, pronto podría alcanzar nuevas alturas aún mayores. Esta iteración implicó el uso de materiales que eran compatibles con una impresora 3D, pero las versiones futuras saltarían aún más con materiales más ligeros.
El autor co-líder y estudiante de PhD de MIT CSAIL Tsun-Hsuan «Johnson» Wang dice que el proyecto es un punto de partida para nuevos diseños de robótica con los que podría ayudar la IA generativa.
«Queremos expandirnos a objetivos más flexibles», dice Wang. «Imagine usar un lenguaje natural para guiar un modelo de difusión para redactar un robot que pueda recoger una taza o operar un taladro eléctrico».
Kim dice que un modelo de difusión también podría ayudar a generar articulación e idear cómo se conectan las piezas, lo que puede mejorar cuán alto saltaría el robot. El equipo también está explorando la posibilidad de agregar más motores para controlar en qué dirección salta la máquina y tal vez mejorar su estabilidad de aterrizaje.
El trabajo de los investigadores fue apoyado, en parte, por el programa emergente de fronteras de investigación e innovación de la National Science Foundation, la Alianza para la Investigación y la Tecnología Singapur para Hombre, Manus y Machina, y la colaboración del Instituto Gwangju de Ciencia y Tecnología (GIST) -CSail. Presentaron su trabajo en la Conferencia Internacional de Robótica y Automatización de 2025.